新商品、行動履歴がなくてレコメンドできない問題をどうする
前回は、人工知能・機械学習の中でも最も基本的な「相関」について紹介しました。ポイントは、ユーザーの行動履歴を「趣味嗜好」という意味でのベクトルとして扱う、という部分です。
さてこの手法、とくにアイテム同士の相関は、商品カテゴリによってはかなり有効なのですが、ひとつ問題があります。
いわゆる「コールドスタート問題」と呼ばれる、「新登場のアイテムは行動履歴がある程度付くまでレコメンドの対象にならない」というものです。 ユーザー同士の相関であれば若干マシですが、いずれにしても行動履歴は必要です。 寿命の長いアイテムの場合は別に構わないのですが、アイテムの寿命が短いものの場合、これは致命的です。
たとえば、ニュース記事はわかりやすい例です。行動履歴がついてレコメンドされる頃に、はもうニュースの賞味期限が切れてしまっているかもしれません。
また、賃貸住宅や仕事の募集情報なども同様です。魅力的な条件の住宅や仕事の募集などは、あっという間に決まってしまいます。
行動履歴がつくのを待っていては、あまり魅力的でない、要は売れ残りのアイテムばかりがレコメンドされることになってしまいます。
ただ、レコメンドは元々が超過収益を狙うものですから、レコメンドしなくても決まるアイテムはそもそもレコメンドしなくていい、という側面もあります。ロングテールを掘り起こしたいということです。
ニュースは、住宅や仕事とは違って、枠という概念がない、つまり先着で誰かが手に入れたら他の人は手に入らないというものではないので、コールドスタート問題がとくに深刻であるともいえます。
アイテム自身が持っている情報を活用して、レコメンドする
さて、こうした場合どうするのがよいでしょうか。率直に言えばこれは、「アイテム自身の情報を活用する」しかありません。
これはよく、メタ情報と言われたりもします。わかりやすいのはカテゴリです。 たとえば『姑獲鳥の夏』という小説は、書誌であり、小説であり、ミステリー小説です。
カテゴリの欠点?は人間が手動で付与するという点です。手間がかかるというのもありますが、そこに人間のセンスが持ち込まれてしまうということがより大きな問題です。
たとえば、とあるUSBケーブルがある場合、これはPC周辺機器なのか、家電なのか、それによって大きく性格が変わってくるといえます。
カテゴリより良い情報として、アイテムが本来そもそも持っている情報があります。たとえば『姑獲鳥の夏』の場合、京極夏彦という著者情報や、「百鬼夜行」というシリーズ情報などです。
別の例で見てみましょう。『ワイルド・スピード(fast and furious)』はカテゴリとして「アクション映画」というのは人間が付与する情報です。
これに対して出演者がヴィン・ディーゼルやポール・ウォーカーというのは映画そのものが持っている、人間のセンスには関係ない情報です。
いずれにしても、こうしたアイテム自身が(付与されたにせよ元々持っているにせよ)持っている情報を活用する、というのがコールドスタート問題を解決するひとつの方法となります。