加入收藏 | 设为首页 | 会员中心 | 我要投稿 衡阳站长网 (https://www.0734zz.cn/)- 数据集成、设备管理、备份、数据加密、智能搜索!
当前位置: 首页 > 站长学院 > MySql教程 > 正文

pydbgen:一个数据库随机生成器

发布时间:2018-11-22 15:21:41 所属栏目:MySql教程 来源:Tirthajyoti Sarkar
导读:用这个简单的工具生成带有多表的大型数据库,让你更好地用 SQL 研究数据科学。 在研究数据科学的过程中,最麻烦的往往不是算法或者技术,而是如何获取到一批原始数据。尽管网上有很多真实优质的数据集可以用于机器学习,然而在学习 SQL 时却不是如此。 对

pydbgen 内置了一个 realistic_email 方法,它基于种子来生成随机的电子邮箱地址。如果你不想在网络上使用真实的电子邮箱地址时,这个功能可以派上用场。

  1. for _ in range(10):
  2. print(myDB.realistic_email('Tirtha Sarkar'))
  3. >>
  4. Tirtha_Sarkar@gmail.com
  5. Sarkar.Tirtha@outlook.com
  6. Tirtha_S48@verizon.com
  7. Tirtha_Sarkar62@yahoo.com
  8. Tirtha.S46@yandex.com
  9. Tirtha.S@att.com
  10. Sarkar.Tirtha60@gmail.com
  11. TirthaSarkar@zoho.com
  12. Sarkar.Tirtha@protonmail.com
  13. Tirtha.S@comcast.net

未来的改进和用户贡献

目前的版本中并不完美。如果你发现了 pydbgen 的 bug 导致它在运行期间发生崩溃,请向我反馈。如果你打算对这个项目贡献代码,也随时欢迎你。当然现在也还有很多改进的方向:

  • pydbgen 作为随机数据生成器,可以集成一些机器学习或统计建模的功能吗?
  • pydbgen 是否会添加可视化功能?

一切皆有可能!

【责任编辑:庞桂玉 TEL:(010)68476606】
点赞 0

(编辑:衡阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读