(井戸端の写真)
AI 音声スタートアップの WellSaid Labs は、企業顧客や規制産業とのニッチ市場を強化しています。より派手な競合他社が幅広い注目と論争を集める中でも、より賢明で舞台裏のアプローチが長期的にはビジネスに利益をもたらすことが期待されています。
ワシントン州ベルビューに拠点を置く同社は月曜日、再設計されたStudioソフトウェアと次世代のCaruso音声モデルを搭載したテキスト読み上げAI音声プラットフォームの新バージョンを発表した。とりわけ、ワークフローの改善、オーディオ品質の向上、微調整されたコントロールなどが約束されます。
公開データを収集するオープンな音声生成モデルとは異なり、WellSaid のシステムはライセンスを取得した声優の録音のみでトレーニングされ、知的財産権を尊重し、医療、法律、金融などの分野にアピールするクローズド モデル アプローチです。
WellSaid の最新リリースは、同社にとって極めて重要な瞬間を迎えています。 「長年にわたる社内研究が、企業ユーザーや機関ユーザーにさらに重点を置いた形で市場に投入されています」とウェルサイド社の最高製品技術責任者、クリス・ジョンソン氏はインタビューで語った。
WellSaid の最高製品および技術責任者、Chris Johnson 氏は次のように述べています。 (井戸端の写真)
「私たちは市場の企業にとって最良のソリューションとなるよう尽力しています」とジョンソン氏は語った。 「これらのイノベーションの多くは私たちにとって現実のものになりました。」
WellSaid は 2019 年にシアトルの AI2 インキュベーターからスピンアウトし、LinkedIn、T-Mobile、ServiceNow、Accenture などの大企業クライアントと連携しています。
同社は2023年、NPRのプラネット・マネーがウェルサイドの技術を利用して元司会者のロバート・スミスの声の合成バージョンを作成し、世間に衝撃を与えた。この音声はほぼ完璧なレプリカであり、リスナーを驚かせ、リアルな AI オーディオの可能性と潜在的な課題の両方を実証しました。
しかしウェルサイドは、業界全体の会話に参加するのに苦労することもあった。この問題は、著名な音声 AI スタートアップ企業の CB Insights 市場マップが存在しないことでさらに浮き彫りになります。その上にあるのが、著名人などの偽の AI 音声を作成するために自社の技術を使用したとして論争の中心となっている Celebrities です。
WellSaid の幹部らは、この特定の見落としを正したいと述べているが、これらの課題はエンタープライズ AI 企業、特にシアトル地域の企業の間での広範なパターンを反映している。これは、ニュースの見出しを飾るシリコンバレーの実験や消費者向けアプリに依然として執着しているテクノロジー文化における信頼、ガバナンス、規制のシナリオを浮き彫りにすることがよくあります。
LinkedInのデータによると、同社の従業員数は約70人で、1年前よりわずかに減少した。
ウェルサイドでは、創業者のマット・ホッキング氏、ブライアン・クック氏に始まり、今年初めに最高財務責任者に就任し、その後クック氏の後任となったベンジャミン・ドール氏と、2年足らずの間に3人のCEOが就任し、経営陣に若干の変化が見られた。
「すべての声は実在の人物と結びついており、その人物はウェルサイドが生み出した収益からロイヤルティを受け取っている」とドー氏はポッドキャスト「マスター・ムーブ」の最近のエピソードで語った。 「声優が正しいことをすれば、私たちを選んでくれる会社も正しいことをしてくれると思いますが、他の人が同じことを言えるとは思えません。」


