非構造データの自動判別、振り分け。マスタデータの作成、更新も非構造データから自動で行います。
膨大な量のデータを処理するのが当たり前となった現在、カテゴリ、マスタ等が共通化されていない、又は存在しない、判別、振り分けが難しい非構造データ、いわゆるダークデータはシステム担当者を悩ませるやっかいな存在です。
TORONOWAは問題を生む非構造データを、自動的に構造化データに変換するための仕組みを提供するサービスです。データ利用の目的から、非構造データを構造化するためにパターンを学習し、自律的に振り分けを行うことができます。たとえば、数十万という企業ホームページのデータから、各ホームページを運営する企業の業種を判別して振り分けたり、数百万の求人情報の内容から各求人の職種を自動で割り当てたりすることが可能です。
振り分けをしていく中で、厄介なのは市場は変化し続けるということです。少し前の自動車業界は製造業でしかありませんでしたが、最近では自動運転の登場などにより、IT業界などとの境目が曖昧なところもでてきます。職種でいっても時代と共に変化し、10年前には存在しなかったデータサイエンティストや、YouTuberにプロゲーマーといったものも登場しています。この変化も自律的に学習し、マスタそのものも更新していくことができるのもTORONOWAの特徴のひとつです。
マスタ自動作成・更新 |
---|
非構造のデータを、管理されているマスタデータに割り振り、構造化されたデータとして利用できる状態にします。必要とされるマスタデータはプロジェクトによって異なるため、導入時に抽出すべき分類をヒアリングをもとに設定していきます。稼働が開始された後は、新たなマスタデータの項目候補を見つけた場合、自動で追加することができます。また、振り分けはテキストデータだけでなく画像データにも対応。テキストのメタ情報が存在しない純粋な画像ファイルも自動で振り分けを行うことが可能です。 |
非構造データ・自動カテゴリ振り分け |
---|
非構造のデータを読み込み、プロジェクトの目的に応じて分類をするためのマスタデータを自動で抽出、作成、更新を行います。分類にあたっては、複数のカテゴリへの割り当てを許可する、しないといった設定も柔軟に可能です。複数のマスタデータのカテゴリに合致した場合は、スコアリングデータが付くため、複数の中から最も適切なカテゴリを選び、利用することもできます。 |
ソリューション・事例
営業リストに掲載されている企業のホームページのデータを収集。そこから各企業の業種や取り扱いサービスを自動判別
ニュースやプレスリリースのテキストから、自動でニュースのカテゴリを作成、自動で振り分け
求人情報の募集情報から自動で募集の職種を特定、振り分けを実施
インターネット上の最新の情報を参考にECサイトの商品カテゴリマスタの自動作成、更新。その後、自社が販売する商品データに対して最新のカテゴリデータを自動割当
学校の学部や学科、コースや授業などのマスタをネット上の様々な非構造データから自動作成。その後、各学校に対して各カテゴリを自動割り振り
大量に保存されている、メタ情報の存在しない画像ファイルを自動でカテゴリに振り分けて、適切な画像を簡単に検索、抽出できるようにする
料金
初期費用 330万円(税別)
月額費用 30万(税別)
- 1日5万ファイル以内、1ファイル2000文字以内の処理を想定した金額となります。処理数によって金額は別途お見積もりが必要となる場合があります
- 構造化する対象のデータ項目は1つを対象とした金額となります。正規化するデータ項目数によって金額は別途お見積もりが必要となる場合があります
- データをインターネット上から収集する必要がある場合は、別途クローラーの費用が必要となります
- 処理データ量により月額費用は別途お見積もりが必要となる場合があります
- 処理結果のデータはお客様のご指定のサーバに提供した後、削除されます。保存の必要がある場合は、別途格納サーバの用意のために費用が必要となります