数据运营开源项目点评

flyte

Python

Kubernetes原生工作流自动化平台,用于大规模的复杂、关键任务数据和ML流程。它已经在Lyft、Spotify、Freenome等公...

fork
305
star
2,936

console

TypeScript

Redpanda Console是一个开发者友好的用户界面,用于管理你的Kafka/Redpanda工作负载。Console为你提供了一个...

fork
261
star
2,888

whylogs

Jupyter Notebook

数据记录的开放标准

fork
86
star
1,939

fast-data-dev

Shell

用于开发的Kafka Docker。Kafka, Zookeeper, Schema Registry, Kafka-Connect, L...

fork
317
star
1,843

argilla

Python

✨ 用于以数据为中心的NLP的开源工具。Argilla帮助领域专家和数据团队在更短的时间内建立更好的NLP数据集。

fork
133
star
1,471

SREWorks

Java

Cloud Native DataOps & AIOps Platform | 云原生数智运维平台

fork
259
star
1,136

stream-reactor

Scala

使用Kafka和Kafka-Connect进行ETL的流参考架构。 ...

fork
343
star
906

elementary

HTML

面向分析工程师的开源数据观察能力。

fork
53
star
876

optimus

Go

Optimus是一个易于使用、可靠和高性能的工作流协调器,用于数据转换、数据建模、管道和数据质量管理。

fork
148
star
676

meltano

Python

你的ELT+的CLI。它是开源的、灵活的,并可根据你的需要进行扩展。使用你熟悉的工具,自信地移动、转换和测试你的数据,你会喜欢的数据工程工...

fork
65
star
556