対象の非構造データ
メーカー、販売会社のホームページのHTMLデータ(1週間で約30万ページ)
作成・更新・付与したい分類、カテゴリ
EC商品のカテゴリマスタを作成、更新
自社の商品データをEC商品のカテゴリマスタに自動振り分け
導入の背景
EC業界では常に新商品が登場するだけでなく、新しいジャンル、商品カテゴリも登場する。以前は携帯電話だけでよかったものが、ある時からは携帯電話の下に、フィーチャーフォン(ガラケー)とスマホという分類ができ、最近ではスマホの下に主要キャリアと格安スマホなどの分類もできてきている。こうした分類は、検索キーワードとして利用されるため、そこに適切に対応していくことはSEOなどの観点でも非常に重要なことだが、商品分類のマスタデータの更新は、それに紐づいている商品データのカテゴリパラメーターも変更する必要があるため、労力が非常にかかるため、継続的、恒常的な見直しが難しく、解決策を模索していた。
構造化内容
メーカーや競合のECサイト、影響力のあるネットメディアのデータの分析し、商品マスタを自動で作成、更新。カテゴリごとに含まれる商品の特徴をAIで解析して、割り振られる商品の特徴をパターン化
主要な製品を作っているメーカーや、競合のECサイトのHTMLデータをWebクローラーで収集して、カテゴリの基本となる材料を用意。各商品が、どのようなカテゴリに割り振られているのかを解析してスコア化。表現として最も好ましいものをスコアから判定し、カテゴリ名称を確定。その後、カテゴリ同士の距離を、HTMLデータから算出してカテゴリの情報構造上の位置を設計。各カテゴリに含まれる商品の特徴を自然言語の特徴から抽出して、各カテゴリごとのパターンを作成。自社の商品のスペック、説明等のデータを、事前に作った各カテゴリのパターンと比較してスコアを作成。スコアデータをもとにメインカテゴリ、サブカテゴリ等を割り振り、商品データを最新のカテゴリに対応。