全世界の人類の完全な名前と生年月日を記録するデータベース構築プロジェクト。複数のオンラインソースからのデータ収集・クリーニング・統合、データベースの最適化、大規模データの処理・管理が課題。公開情報の自動抽出、データ品質管理、重複排除などが必要。
まだコメントはありません