搜罗一些有趣的数据和项目


#1

1. Stack overflow public data dump

Stack Exchange 上所有数据的匿名转储


一篇相关的文章
Import 10M Stack Overflow Questions into Neo4j in Just 3 Minutes

2. NLP 深度学习工具包


GluonNLP 提供了 NLP 方向的顶尖深度学习模型实现,并且构建了文本数据管道和模型的模块。它专门面向工程师、研究人员和学者设计,大家可以基于这些模型快速实现研究思路,做出产品原型。

该项目具有如下特征:

  1. 训练脚本来重现论文中的 state-of-the-art 结果;

  2. 针对常见 NLP 任务的预训练模型;

  3. 精心设计的 API,可以极大减少实现的复杂性;

  4. 中文社区支持。

3. 深度学习工程模板


由美图云事业部开源的深度学习工程模板,简化加载数据、构建网络、训练模型和预测样本的流程。

4. DeepLearning4j

https://deeplearning4j.org/