数据科学开源项目点评

keras

Python

面向人类的深度学习

fork
19,232
star
56,876

superset

TypeScript

Apache Superset是一个数据可视化和数据探索平台

fork
9,924
star
49,764

ray

Python

Ray是一个统一的框架,用于扩展人工智能和Python应用程序。Ray由一个核心的分布式运行时和一个用于加速ML工作负载的库工具包(Ray...

fork
4,072
star
23,136

streamlit

Python

Streamlit - 在Python中构建数据应用程序的最快方式

fork
1,959
star
21,873

lightning

Python

构建和训练PyTorch模型,并使用Lightning App模板将其连接到ML生命周期,而无需处理DIY基础设施、成本管理、扩展和其他令...

fork
2,686
star
21,002

prefect

Python

协调你的数据流的最简单方法

fork
1,084
star
10,696

catboost

C

一个快速、可扩展、高性能的决策树梯度提升库,用于Python、R、Java、C++中的排名、分类、回归和其他机器学习任务。支持在CPU和G...

fork
1,070
star
6,848

cudf

C++

cuDF - GPU DataFrame库

fork
663
star
5,211

fastpages

Jupyter Notebook

一个易于使用的博客平台,加强了对Jupyter笔记本的支持。

fork
797
star
3,438

flyte

Python

Kubernetes原生工作流自动化平台,用于大规模的复杂、关键任务数据和ML流程。它已经在Lyft、Spotify、Freenome等公...

fork
305
star
2,936

ploomber

Python

构建数据管道的最快⚡️方式。迭代开发,随时部署。☁️

fork
199
star
2,876

whylogs

Jupyter Notebook

数据记录的开放标准

fork
86
star
1,939

argilla

Python

✨ 用于以数据为中心的NLP的开源工具。Argilla帮助领域专家和数据团队在更短的时间内建立更好的NLP数据集。

fork
133
star
1,471

DLTK

Python

用于医学图像分析的深度学习工具包

fork
405
star
1,345

gpubootcamp

Jupyter Notebook

这个资源库包括用于HPC和AI的GPU训练营材料。

fork
222
star
402