数据运营开源项目点评

flyte

Python

Kubernetes原生工作流自动化平台,用于大规模的复杂、关键任务数据和ML流程。它已经在Lyft、Spotify、Freenome等公...

fork
305
star
2,936

whylogs

Jupyter Notebook

数据记录的开放标准

fork
86
star
1,939

fast-data-dev

Shell

用于开发的Kafka Docker。Kafka, Zookeeper, Schema Registry, Kafka-Connect, L...

fork
317
star
1,843

argilla

Python

✨ 用于以数据为中心的NLP的开源工具。Argilla帮助领域专家和数据团队在更短的时间内建立更好的NLP数据集。

fork
133
star
1,471

SREWorks

Java

Cloud Native DataOps & AIOps Platform | 云原生数智运维平台

fork
259
star
1,136

stream-reactor

Scala

使用Kafka和Kafka-Connect进行ETL的流参考架构。 ...

fork
343
star
906

elementary

HTML

面向分析工程师的开源数据观察能力。

fork
53
star
876

optimus

Go

Optimus是一个易于使用、可靠和高性能的工作流协调器,用于数据转换、数据建模、管道和数据质量管理。

fork
148
star
676