AIキュレーションが「ガジェットカタログ」になってしまう問題を直した話
AIに「もっと幅広く選んで」と頼んでも変わらなかった。原因はAIではなくデータの入り口だった。
毎日、YouTube動画を自動収集→Gemini(LLM)で評価・要約→Ghostブログに自動投稿、という完全自動のテックニュースキュレーション「Global Tech Video Watch」を運用している。
二ヶ月ほど運用しているが一つ不満が出てきた。
毎日毎日、同じようなスマホやPCのレビュー動画ばかり選ばれる。
たまに面白い最新技術ニュースが混ざるものの、基本的にはガジェット新製品カタログ状態。本当に欲しいのは、AIやロボティクス、サイバーセキュリティなど「社会を動かしそうなテックトレンド」も含んだラインナップだった。AIエージェントに「もっと幅広く選んでよ」と指示を足してみたが、変化なし。コードの根本から見直すことにした。
原因は「AIの頭脳」ではなく「エサ」と「役割縛り」
スクリプトを調査したところ、問題は生成AI側の問題というよりも、AIに渡すデータと役割指定の2箇所に問題がありそうだった。入力が偏っていれば出力も偏る、という話だ。
①情報収集元の偏り YouTube APIへの検索クエリがこうなっていた。
"q": "レビュー|開封|比較|新型|実機 -軍 -兵器 -ミサイル"
「開封」「実機」で検索すれば、返ってくる動画の大半はガジェットレビュー。AIがどんなに優秀でも、候補がスマホばかりならスマホを選ぶしかないわけだ。ここはチェックミスだった。
②プロンプトの無意識な制限 選定役のGeminiへの指示にこう書いてあった。
純粋なコンシューマーテクノロジー動画を厳選し…
せっかく深いAI関連動画が紛れ込んでも、「消費者向けガジェットじゃないから除外」とAI自身が弾いてしまう構造になっていた。データの入り口とAIの判断基準、両方がガジェット方向にロックされていたというわけだ。
解決:入り口と出口の両方を直す
ステップ1:検索テーマを分割 APIクエリを「Gadget」と「Advanced/Society」の2系統に分け、それぞれに取得件数の上限を設定した。
"themes": [
{
"name": "Gadget",
"q": "レビュー|開封|比較|新型|実機..."
},
{
"name": "Advanced/Society",
"q": "AI|人工知能|ロボット|イノベーション|社会実装|サイバーセキュリティ..."
}
]
これでガジェット系が候補リストを埋め尽くす構造自体がなくなる。
ステップ2:プロンプトの制約を解放 「コンシューマー向け」縛りを外し、社会インパクト重視+多様性確保に書き換えた。
改修前のプロンプト(抜粋):
「純粋なコンシューマーテクノロジー動画を厳選し…」
改修後:
「社会に影響を与える最新テクノロジーを優先的に厳選し、分野の多様性を確保すること」
結果
改修後にスクリプトを再実行したところ、「新型iPhoneリーク」「PC周辺機器レビュー」一色だった記事リストが一変。Claude Codeの活用法、スマホ上で動くローカルLLM「Gemma 4」の検証など、ちゃんと幅のあるトピックが並ぶようになった。
プロンプトだけいじっても変わらなかったものが、データソースの構造を変えた途端に動き出した。入り口のデータ多様性と、出口の選定基準。結局この両輪の話だった。
P.S.
その改修後の成果物がこちら。 http://video.kwmr.me/ ご愛顧の程…w
Comments ()