LinuCエヴァンジェリスト・Open Source Summit Japanボランティアリーダーの鯨井貴博@opensourcetechです。
LF AI & DATA FOUNDATION Project一覧
LF AI & DATA FOUNDATION Project一覧
プロジェクト名: 1chipML
- プロジェクト概要: マイクロコントローラー向けの基本的な数値計算および機械学習のためのオープンソースライブラリ。
プロジェクト名: Acumos AI
- プロジェクト概要: AIアプリケーションの構築、共有、デプロイを容易にするプラットフォームとオープンソースフレームワーク。
プロジェクト名: Adlik
- プロジェクト概要: ディープラーニング推論を高速化するためのツールキット。
プロジェクト名: Adversarial Robustness Toolbox
- プロジェクト概要: 機械学習モデルを敵対的脅威から評価、防御、認証、検証するためのツール。
プロジェクト名: AI Explainability 360
- プロジェクト概要: 機械学習モデルがどのように予測を行うかをユーザーが理解するのに役立つオープンソースツールキット。
プロジェクト名: AI Fairness 360
- プロジェクト概要: 機械学習モデルにおけるバイアスを理解し、軽減するのに役立つ拡張可能なオープンソースツールキット。
プロジェクト名: Amundsen
- プロジェクト概要: データアナリスト、データサイエンティスト、エンジニアの生産性を向上させるためのデータディスカバリおよびメタデータエンジン。
プロジェクト名: Angel ML
- プロジェクト概要: Parameter Serverに基づいた高性能分散機械学習プラットフォームで、YARNとApache Spark上で動作。
プロジェクト名: Artigraph
- プロジェクト概要: データの作成、管理、品質向上を目的としたツール。
プロジェクト名: BeeAI
- プロジェクト概要: プロダクション対応のエージェントを構築するためのオープンソースフレームワーク。
プロジェクト名: BeyondML
- プロジェクト概要: 複数のデータドメインで複数のタスクを実行できる疎なニューラルネットワークを開発するためのフレームワーク。
プロジェクト名: BITOL
- プロジェクト概要: データ正規化、ドキュメント関連性、サービスレベルの期待値設定、データとツールの統合の簡素化、データ製品指向のアプローチ促進といった課題に取り組む。
プロジェクト名: CLAIMED
- プロジェクト概要: ランタイムおよびプログラミング言語に依存しないデータ&AIコンポーネントフレームワーク。
プロジェクト名: Data Prep Kit
- プロジェクト概要: LLMアプリケーション開発のための非構造化データ準備を簡素化する。
プロジェクト名: Datashim
- プロジェクト概要: Kubernetes/Openshiftワークロードのデータアクセスを透過的かつ宣言的に可能にし、加速する。
プロジェクト名: DeepCausality
- プロジェクト概要: 高速で決定論的なコンテキスト認識型因果推論のための超幾何計算因果ライブラリ。
プロジェクト名: DeepRec
- プロジェクト概要: TensorFlow 1.15、Intel-TensorFlow、NVIDIA-TensorFlowに基づいた高性能な推薦ディープラーニングフレームワーク。
プロジェクト名: Delta
- プロジェクト概要: ディープラーニングに基づいたエンドツーエンドの自然言語処理および音声処理プラットフォーム。
プロジェクト名: Delta Lake
- プロジェクト概要: データレイクに信頼性をもたらすオープンソースのストレージレイヤー。
プロジェクト名: DLRover
- プロジェクト概要: 分散クラスター上でのディープラーニングモデルのトレーニングを通じて、大規模AIモデルの分散トレーニングを容易、安定、高速、かつグリーンにする。
プロジェクト名: DocArray
- プロジェクト概要: ネストされた非構造化マルチモーダルデータを転送するためのライブラリ。
プロジェクト名: Docling
- プロジェクト概要: ドキュメント処理を簡素化し、多様なフォーマット(高度なPDF理解を含む)を解析し、gen AIエコシステムとのシームレスな統合を提供する。
プロジェクト名: Egeria
- プロジェクト概要: 世界初のオープンソースメタデータ標準。
プロジェクト名: Egeria Conformance
- プロジェクト概要: Egeriaによって推進される標準との一貫性と整合性を保証する。
プロジェクト名: Elastic Deep Learning (EDL)
- プロジェクト概要: PaddlePaddleやTensorFlowなどのディープラーニングフレームワークを使用して、ディープラーニングクラウドサービスプロバイダーがクラスタークラウドサービスを構築するのを支援するために設計されたElastic Deep Learningフレームワーク。
プロジェクト名: Elyra
- プロジェクト概要: 再現性、スケーラブル、コンポーネントベースのデータサイエンスパイプラインを作成するためのオープンソースのローコード/ノーコードフレームワーク。
プロジェクト名: FATE
- プロジェクト概要: データセキュリティとプライバシーを保護しながら、企業や機関がデータで共同作業できるようにする、世界初の産業用フェデレーテッドラーニングオープンソースフレームワーク。
プロジェクト名: Feast
- プロジェクト概要: 機械学習のためのオープンソースの特徴量ストア。
プロジェクト名: Feathr
- プロジェクト概要: エンタープライズグレードの高性能な特徴量ストア。
プロジェクト名: FlagAI
- プロジェクト概要: 大規模モデルのための高速で使いやすく、拡張可能なツールキット。
プロジェクト名: Flyte
- プロジェクト概要: プロダクショングレードの宣言的、構造的、高スケーラブルなクラウドネイティブなワークフローオーケストレーションプラットフォーム。
プロジェクト名: ForestFlow
- プロジェクト概要: スケーラブルなポリシーベースのクラウドネイティブ機械学習モデルサーバー。
プロジェクト名: Generative AI Commons
- プロジェクト概要: 効率的、安全、信頼性、倫理的な生成AIオープンソースイノベーションの民主化、進歩、採用を促進することにコミット。
プロジェクト名: Horovod
- プロジェクト概要: 単一GPUのTensorFlowプログラムを多くのGPUで高速にトレーニングすることを容易にする。
プロジェクト名: Intersectional Fairness (ISF)
- プロジェクト概要: 複数の保護された属性の組み合わせによって引き起こされる交差的バイアスに対処するためのバイアス検出および軽減技術。
プロジェクト名: IREE
- プロジェクト概要: LF AI & Data Foundationのサンドボックスステージプロジェクト。
プロジェクト名: JanusGraph
- プロジェクト概要: 数百億の頂点とエッジをマルチマシンクラスターに分散して保存およびクエリすることに最適化されたスケーラブルなグラフデータベース。
プロジェクト名: Kedro
- プロジェクト概要: 再現性、保守性、モジュール性のあるデータサイエンスコードを作成するためのオープンソースPythonフレームワーク。
プロジェクト名: Kompute
- プロジェクト概要: クロスベンダーのグラフィックカード(AMD、Qualcomm、NVIDIAなど)向けの汎用GPUコンピューティングフレームワーク。
プロジェクト名: KServe
- プロジェクト概要: 任意のフレームワーク上で機械学習(ML)モデルをサービングするためのKubernetesカスタムリソース定義を提供する。
プロジェクト名: LakeSoul
- プロジェクト概要: DMetaSoulチームによって開発されたクラウドネイティブなレイクハウスフレームワークで、スケーラブルなメタデータ管理、ACIDトランザクション、効率的かつ柔軟なアップサート操作、スキーマ進化、および統合されたストリーミング&バッチ処理をサポート。
プロジェクト名: Ludwig
- プロジェクト概要: シンプルで柔軟なデータ駆動型構成システムでディープラーニングパイプラインを定義することを容易にするオープンソースの宣言型機械学習フレームワーク。
プロジェクト名: Machine Learning eXchange
- プロジェクト概要: データおよびAIアセットカタログと実行エンジン。
プロジェクト名: Marquez
- プロジェクト概要: データエコシステムのメタデータの収集、集約、視覚化のためのオープンソースメタデータサービス。
プロジェクト名: Milvus
- プロジェクト概要: 非常に柔軟で信頼性が高く、高速なオープンソースベクトルデータベース。
プロジェクト名: Monocle
- プロジェクト概要: AI Observability as a Service。生成AIアプリケーションを監視するためのドメイン固有のトレーシング+メトリクスフレームワーク。
プロジェクト名: NNStreamer
- プロジェクト概要: ニューラルネットワークモデルをGstreamer開発者が容易かつ効率的に採用し、ニューラルネットワーク開発者がニューラルネットワークパイプラインとそのフィルターを管理できるようにするGstreamerプラグインのセット。
プロジェクト名: OAAX
- プロジェクト概要: エッジAIアプリケーションの開発とデプロイを簡素化するために設計されたオープン標準。
プロジェクト名: ONNX
- プロジェクト概要: ディープラーニングモデルを表現するためのオープンフォーマット。
プロジェクト名: Open Model Initiative
- プロジェクト概要: 画像、ビデオ、オーディオ生成のためのオープンライセンスのベースラインAIモデルのオープンコミュニティ開発をサポート。
プロジェクト名: Open Platform for Enterprise AI
- プロジェクト概要: パフォーマンスの高いGenAI技術とワークフローを効率的に統合し、GenAIの採用とビジネス価値の向上を迅速化するためのエコシステムオーケストレーションフレームワークを開発。
プロジェクト名: OpenBytes
- プロジェクト概要: データ標準とフォーマットの推進、およびデータの貢献を可能にすることで、AIコミュニティにおけるデータのより広範な共有とコラボレーションを促進することを目指す。
プロジェクト名: OpenDataology
- プロジェクト概要: オープンソースデータセットライセンスコンプライアンス分析プロジェクト。
プロジェクト名: OpenDS4All
- プロジェクト概要: 教育用データサイエンスプログラムの作成を可能にする。
プロジェクト名: OpenFL
- プロジェクト概要: 組織が機密情報を共有することなく共同でモデルをトレーニングできるフェデレーテッドラーニングのためのPython 3ライブラリ。
プロジェクト名: OpenLineage
- プロジェクト概要: リネージ収集のためのオープン標準とAPIを提案する。
プロジェクト名: Pyro
- プロジェクト概要: Pythonで書かれ、PyTorchをバックエンドでサポートする汎用確率的プログラミング言語(PPL)。
プロジェクト名: Recommenders
- プロジェクト概要: 推薦システムに関するベストプラクティス。
プロジェクト名: RosaeNLG
- プロジェクト概要: 構造化された入力データとテキストテンプレートに基づいて繰り返しのテキスト生成を自動化するオープンソースプロジェクト。
プロジェクト名: RWKV
- プロジェクト概要: TransformerレベルのLLMパフォーマンスを持つ並列化可能なRNN。
プロジェクト名: RYOMA
- プロジェクト概要: データ分析のために設計された汎用LLMエージェントフレームワークを構築する。
プロジェクト名: SapientML
- プロジェクト概要: AIモデル作成プロセスの成功を高めるために設計されたメタ学習ベースのAutoMLイニシアチブ。
プロジェクト名: ShaderNN
- プロジェクト概要: モバイルプラットフォームの畳み込みニューラルネットワークに最適化された軽量ディープラーニング推論フレームワーク。
プロジェクト名: SOAJS
- プロジェクト概要: オープンソースのマイクロサービスおよびAPI管理プラットフォーム。
プロジェクト名: Sparklyr
- プロジェクト概要: Apache Spark™、R、および豊富な拡張エコシステムを使用してデータサイエンスおよび機械学習ワークフローをスケーリングするためのオープンソースの最新インターフェース。
プロジェクト名: Substra
- プロジェクト概要: パートナー間で機械学習タスクの分散オーケストレーションを提供し、すべての操作の安全で信頼性の高い追跡可能性を保証するフレームワーク。
プロジェクト名: The Open Voice Interoperability Initiative
- プロジェクト概要: HTTPおよびHTMLと同様に、音声/チャットボットと言語モデルの相互運用性のための普遍的なオープンAPI「メッセージエンベロープ」を開発。
プロジェクト名: The Open Voice Network Trust Mark Initiative
- プロジェクト概要: 会話型AIに焦点を当て、倫理的原則を行動に移す。
プロジェクト名: TonY
- プロジェクト概要: Apache Hadoop上でディープラーニングジョブをネイティブに実行するためのフレームワーク。
プロジェクト名: Unity Catalog
- プロジェクト概要: データとAIのための業界唯一のユニバーサルカタログ。
プロジェクト名: Xtreme1
- プロジェクト概要: マルチセンサートレーニングデータのための次世代オープンソースプラットフォーム。