デ ローゼン氏が先週の電話で私に語った問題は、さまざまな AI モデルが、ブランドの製品提供をどのように特徴付けるかにおいて一貫性がある傾向があることだという。一般に、製品の機能、性能、およびそれらの機能が競合製品とどのように比較されるかを正確に報告し、その情報源の引用を提供することはできますが、会社の財務的安定性、ガバナンス、および技術認定に関連する質問をすることは一貫性がなく、間違いが発生しやすい可能性があります。ただし、この情報は重要な調達決定において重要な役割を果たす可能性があります。
AI モデルは、財務およびガバナンスの問題に関して信頼性が低くなります。
一例として、AIVO Standard は、急成長している経費管理ソフトウェア会社である Ramp の質問に、先駆的な AI モデルがどのように答えているかを評価しました。 AIVO Standard では、このモデルでは Ramp のサイバーセキュリティ認定とガバナンス基準に関する質問に確実に答えることができないことが判明しました。デローゼン氏は、場合によっては、より大規模な上場企業が関与する調達決定を行うよう、企業に微妙な圧力がかかる可能性があると述べた。たとえ民間企業が同じ基準を満たしているとしても、これは単純に、AI モデルが若い民間企業のガバナンスや財務的適合性に関する質問に正確に答えられなかったり、民間企業が提供する情報源を引用したりできないからです。
別の例では、競合する減量薬の危険因子について AI モデルが何を言っているかを調べました。 AI モデルは、単に危険因子を列挙するだけでなく、どの薬剤が患者にとって「より安全な選択」であるかについて推奨や判断を行うことができていないことがわかりました。 「結果は主に事実に基づいており、免責条項も含まれていますが、それでも資格、リスク認識、好みを形成しました」とデローゼン氏は述べた。
AIVO Standard は、これらの問題がすべての主要な AI モデルおよびさまざまなプロンプトにわたって存在し、モデルが答えを検証するように求められた場合でも存続することを発見しました。実際、場合によっては、モデルは不正確な情報を強調しながら、正確であると主張する傾向がありました。
GEO は依然として科学というよりも芸術です。
いくつかの影響があります。1 つは、GEO サービスを販売する企業にとって、GEO はブランド情報のさまざまな側面においてうまく機能しない可能性があるということです。企業は、チャットボットの応答で自社のブランドがどのように表示されるかを示すことができると主張するマーケティングテクノロジー企業を必ずしも信頼すべきではありません。マーケティングテクノロジー企業がAIの応答を確実に形成するための魔法の公式を持っていると信じるべきではありません。評価しているブランド情報の種類に応じて、即時の結果は分ごとに大きく異なる可能性があります。また、製品以外の情報に対するチャットボットの応答を正確に誘導する方法については、まだ多くの証拠がありません。
しかし、さらに大きな問題は、人間がループに関与している場合でも、多くのエージェントのワークフローには、AI によって提供される情報が意思決定の基礎となる瞬間があることです。そして、デ・ローゼン氏が言うように、今日のほとんどの企業は、情報、判断、意思決定の境界を実際には管理していません。どのプロンプトが使用されたか、モデルが応答として何を返したか、そしてこれが最終的な推奨事項や決定にどのように適用されたかを正確に追跡する方法はありません。金融や医療などの規制が厳しい業界では、問題が発生したときに規制当局は正確な詳細を要求します。そして、規制対象の企業がこれらすべてのデータを収集するシステムを実装していないと、問題が発生します。
AIの運
Anthropic は、数十のスタートアップを脅かす可能性のあるファイル管理 AI エージェントである Claude Cowork を立ち上げました。作者: ベアトリス ノーラン英国違法ディープフェイク疑惑をめぐるXへの捜査は、米国との言論の自由の戦いを引き起こす危険性がある。 by Beatrice Nolanマレーシアとインドネシア、露骨な性的ディープフェイクを巡りマスク氏のGrok AIの禁止に動く—アンジェリカ・アン
Anthropic は、Claude for Healthcare を発表し、ライフ サイエンス機能を拡張し、HealthEx と協力してユーザーが自分の医療記録を接続できるようにします。投稿者: ジェレミー・カーン
ニュースにおける AI
AppleはアップデートされたSiriにGoogleのAIを選択した。 Appleは月曜日、待望のSiriアップグレードを含む自社製品の主要なAI機能を強化するため、Googleとの複数年にわたる提携を発表した。この提携はグーグルのAI復活を強調し、グーグルの親会社アルファベットの市場価値を4兆ドル以上に押し上げることに貢献する。 Appleは、この契約はOpenAIとの既存のパートナーシップを変更するものではないと述べ、現在Siriを通じて一部のクエリをChatGPTに転送している。しかし、Googleとの提携がSiriの将来のAI統合をどのように形作るかは不明だ。ブルームバーグは以前、アップルが同社のSiri用AIモデルへのアクセス料としてグーグルに年間10億ドルを支払うことを検討していると報じたが、契約の金銭的条件も明らかにされていない。
AI研究に注目
マイクロソフト、エヌビディア、英国のスタートアップ企業ベースキャンプ・リサーチは、遺伝子編集においてAIを活用した画期的な進歩を遂げた。 Nvidia と Microsoft の科学者からなる国際研究チームは、AI を使用して 100 万種以上の生物種から進化データをマイニングし、新しい遺伝子編集ツールや薬物治療の可能性を設計しました。チームは、Eden と呼ばれる一連の AI モデルを開発しました。このモデルは、Basecamp によって収集された未公開の大規模な生物学的データセットに基づいてトレーニングされました。 Nvidia のベンチャーキャピタル部門は Basecamp に投資しています。
あなたはカレンダーを持っています
1月19~23日:世界経済フォーラム、ダボス、スイス。
1 月 20 ~ 27 日: AAAI 人工知能カンファレンス、シンガポール。
2 月 10 ~ 11 日: AI アクション サミット、インド、ニューデリー。
3 月 2 ~ 5 日: Mobile World Congress、スペイン、バルセロナ
3 月 16 ~ 19 日: Nvidia GTC、カリフォルニア州サンノゼ
脳の食べ物
もし人々がAIによって書かれた小説を好む場合、あるいはその違いが分からない場合はどうなるでしょうか?それが、ニューヨーカー誌のライター、ヴァウディニ・ヴァラ氏が、数週間前に同誌のウェブサイトに「今週のエッセイ」として掲載された挑発的なエッセイの中で尋ねた質問だ。基本的な AI モデルは、トップの MFA プログラムの卒業生や経験豊富な小説家と同じくらい説得力のある物語を生成するのに引き続き苦労していますが、確立された作家の作品に基づいてこれらのモデルを微調整することで、元の著者が作成した散文と区別できない散文を作成できることが示されています。驚くべきことに、AI モデルの創造的な文章作成能力に関してこれまでで最高の実験を行った研究者のトゥーヒン・チャクラバーティ氏が行ったテストでは、ヴァラは自分の言葉を少し異なる形式で繰り返しました。文学読者 (例: MFA 学生) でさえ、人間が書いた散文よりも AI が書いたバージョンを好みます。それでは、ジャンル小説やロマンス小説の作家にはどんな希望があるのでしょうか?数か月前、私は有名な小説家の友人と会話しました。彼は、将来の世代が人間が書いた文学を評価するかどうかについて悲観的でした。私は、読者は人間の書き手とコミュニケーションをとっているという考え、言葉の背後に生きた経験を持った心が存在するという考えに常に興味をもつだろうと主張してきました。彼には確信が持てませんでした。そして、彼の悲観論には十分な根拠があるのではないかとますます心配になる。ヴァラ氏は最終的に、ページ全体にわたって生きた経験を伝えるものとしての文学という概念を維持する唯一の方法は、私たちが集団的にそれを要求することである(そしておそらくは、確立された作家の作品に対するAIモデルの微調整さえも禁止することだ)と結論付けている。それが現実的かどうかはわかりません。しかし、それが私たちに残された唯一の選択肢かもしれません。
FORTUNE AIQ: AI の年とその先にあるもの
最高 AI オフィサーの採用から AI エージェントの実験に至るまで、企業は 2025 年の AI への取り組みにおいて大きな進歩を遂げました。良いことも悪いことも含めて学んだ教訓と最新の技術革新が組み合わさることで、2026 年は新たな決定的な年となるでしょう。 Fortune AIQ のすべてを探索し、以下の最新のプレイブックをお読みください。
– 2025 年のエンタープライズ AI 展開を支配する 3 つのトレンド。
– 2025 年はエージェント AI の年でした。私たちが何をしたのですか?
–AI コーディング ツールは 2025 年に爆発的に増加します。最初のセキュリティ攻撃は、何が問題になるかを示しています。
– 2026 年のビジネスに向けた AI 新年の抱負: ROI。
– 企業は、混乱を招く AI ポリシーとルールのパッチワークに直面しています。透明性は近づいていますか?


