AIや機械学習は今では最も重要な技術であり、研究開発の中心になっています。
その実情で、AI開発の先頭に立っている弊社は機械学習用のデータセットを作成するサービスを提供し始めました。
高品質なデータセットを作成するには、データの量産が必要である。したがって、大きい人力と精密な生産管理が不可欠である。
大量だけでなく、データの多様性も手配しないといけない。そのため、膨大な費用がかかります。
効率のいい識別ルールが必要なのにノウハウがない。
大きいチームで作業するため、効率な生産管理・品質検査が課題となる。
エントリシステム作成
入稿方法、納品方法、タイミング確定
対象データ分析し、エントリシステム作成(既存システムからカスタマイズ)
入力支援機能のカスタマイズ
改善活動
改善点を洗い出し、PDCAをまわす
入力システムの改善(効率化向上)
BPO開始
少ないボリュームからスタートし、徐々に増やしていく
教育
マニュアル作成
事前教育
テストデータで実施しながら効率のよい方法を教える。
テストデータの結果をチェックし、分析する
OJT教育
入力ポイント作成、チェックリスト作成、チェックフロー確立
画像アノテーション
1.概要
ドライブレコーダーからの画像のアノテーション
画像は昼間、夜、雨、雪、都会、郊外など様々な種類
2.件数と期間
3400枚で1.5ヶ月程度
体制:ピーク時30人(作業者+チェッカー)
手書きデータのラベル付け
1.概要
手書きのデータのラベノレ付け
氏名、住所、電話番号など
2.件数と期間
毎月10万字前後(主に漢字、ひらがな、カタカナ)
体制:ピーク時10人(作業者+チェッカー)