
Awaneesh Verma は、Alphabet で Google Meet、Google Voice、およびその他のリアルタイム コミュニケーション製品を監督し、世界中の約 30 億人のユーザーと 1,100 万の企業への接続の大規模ネットワークを監督しています。
しかし、コミュニケーション上の摩擦を排除し、人々が「真にお互いを理解」できるようにしたいという彼の意欲は、Uber や Duolingo が誕生する前の時代にまで遡る個人的な旅に根ざしており、当時、人々のコミュニケーションが障壁によってどのように妨げられているかを学んだのです。
インドから移民した両親のもとイギリスで生まれたヴェルマは、幼少期をシェフィールドの中心都市で過ごしました。彼は最近、フォーチュン誌のインタビューで、長い間自分が「クラスで唯一のインド人の子供」だったと回想した。
故郷は「いいところだった」が、「あの世はどんな感じだろう、どんな景色だろう」と思わずにはいられなかった。彼は、Google マップが登場する数日前に、物理的な地図帳にどれほど魅了されていたかを思い出しました。 「地図を見て、それに基づいて場所を描くようなものです。」
数年後、ヴェルマ氏がピッツバーグのカーネギーメロン大学でエンジニアリングを学んでいたとき、Googleのエンジニアリング責任者であるアラン・ユースタス氏がGoogle翻訳を含む進行中のプロジェクトについて話しているのを聞いた。 「『すごい、これが人々をつなぐ未来だ』と思いました。」数年のうちに、Verma 氏は Google 翻訳に取り組みました。これは、最初のプロダクト リードとして Duolingo に入社し、Uber でプロジェクト リードとして働いた後、Google に戻るという旅の一環でした。
ヴァーマさんはフォーチュン誌に対し、旅行関連のアイデアがずっと好きだったため自分の仕事が大好きで、若い頃は旅行番組の司会者になりたかったと語った。
「異なる文化を持つ人々と出会い、お互いを真に理解するという魅力が本当に気に入りました。」彼は、それができる仕事に就けて幸運だと感じていると付け加えた。
マシンを運転しながらのベータテスト
Google Meetの責任者であるVerma氏はフォーチュンに対し、何十億ものユーザーがビジネスを行う上で依存している自社製品のベータテストを常に行っていると語った。 (より具体的には、初期の研究の概念実証からエンドユーザーのプロトタイプやベータ版に至るまで、常に社内で製品をテストしていると同氏は述べた。)Google Meet の利点は、Google Workspace の一部であること、つまり、メモを取るすべてのものが Google Drive の一部になることだと同氏は述べた。
ヴェルマさんは、「ほぼすべての会議」でジェミニとメモを取るのを使っていると語った。このツールは、ワンクリックで会議議事録を含むリアルタイムの Google ドキュメントを即座に作成します。この文書はチームの「記録の決定」となり、議論は「継続的かつ永続的な」議論に変わります。
同氏は、ストックホルムのチームの 3 分の 1 が自信を持って不便な会議をスキップできると感じていたときのことを思い出しながら、この安定性のおかげで分散型コラボレーションが容易になったと指摘しました。これは、ほんの数年前と比較すると大きな変化でした。チームはベイエリアに拠点を置く一部の幹部からフィードバックを得ようとしたが、タイミングが合わなかった。それにもかかわらず、彼らは彼らなしでも会議は進むだろうと確信していました。 「あなたが私たちの意見をよく代表してくれると信じています。後でメモと記録を読みます。」
Google Meet のリーダーは、頻繁にプロジェクトの報告会を行っており、何がうまくいったのか、何が違っていればよかったのかをチームメンバーに尋ねていると語った。ホワイトボードにすべてを書き留めた後、Gemini AI メモ作成者が会議についてどう思ったかを相互参照します。 「疑問がある場合は、記録に戻って読んでください」と彼は言いました。 Gemini には引用が含まれているため、疑問がある場合は、記録のその部分を 1 回クリックして、そこで何が起こったのかを読むことができます。
目標は、AI を使用して口調や感情を含む人間の会話の忠実度を高め、チームが非同期コミュニケーションよりも早く解決策に到達できるようにすることです。 Verma 氏は、エンジニアリング担当者との 60 分間のディスカッションでこれについて説明しました。 Ask Gemini を使用して概要を説明することにより、すぐに 15 個の製品仕様を作成しました。
リアルタイム翻訳
ヴェルマ氏と彼のチームのイノベーションは、前述のストックホルムの Google オフィスで働くドイツ語を母語とするニクラス・ブルム氏とフォーチュンが対談したときに生き生きとします。彼は、Google 翻訳とはまったく異なる製品である Google のリアルタイム音声翻訳をデモンストレーションします。
「聞こえませんか、ニック?私はドイツ語で話しているんです」とブラムは言った。この記者は、背後で彼がゲルマン語のようなことを言っているのを聞いたが、数秒後には、かなり奇妙なことに彼の声が英語でスピーカーから聞こえてきた。
ブルーム氏は、AI技術が現在では彼の声をリアルタイムで複製して英語を話しているように聞こえるところまで進歩していると説明した。
同氏は、Verma氏のチームがGoogleのDeepMindと緊密に連携し、翻訳や翻訳音声の生成など、AIの複数の層が機能するさまざまなテクノロジーに取り組んでいると付け加えた。同氏は、AIは使用されている言語の文法と複雑さを考慮する必要があるため、遅延は翻訳される言語に大きく依存すると述べた。たとえば、ドイツ語では動詞が文の最後に配置されることが多く、AI がそれらの動詞の意味が正しいかどうかを確認するため、遅延が発生します。
Blum 氏は、このリアルタイム翻訳ツールは約 2 年かけてまとめられ、具体的な期限はなく探求として開始されたと付け加えました。しかし、言語の壁を越えてビジネスを行うグローバル企業とコミュニケーションを深めれば重ねるほど、市場でのニーズがさらに高まることがわかりました。
同氏は、全員が正しい情報を確実に受け取れるようにしながら、さまざまな言語でチームの会話を行うのは「本当に難しい」と語った。 「私たちは、Google Meet が人々を結び付けるだけでなく、会話に価値を生み出すツールであってほしいと考えています。」と彼は付け加えました。
「テクノロジーの美しさは、自動化して簡単にできるという事実だけでなく、ユーザーの発言すべてを中立的に表現していると信頼できることです」とヴェルマ氏は言う。
もちろん、その裏には何か必要なものがあります。それは、パンデミック以来、ほとんどの勤務日を規定してきた終わりのない会議に何らかの方法で解決策を提供することです。
ヴェルマ氏は、これは多くの場合非効果的で、何が決定され、次に何が起こるのか参加者が分からないままになると指摘しています。会議が適切に行われないことで生じる「会議疲れ」を解消する必要性を切実に感じているという。
Verma 氏は、すべての改善は「これをより良くするためにどのように支援したか?」という質問によってフィルタリングされると主張します。


