在創(chuàng)始人兼首席執(zhí)行官 Mark Fox 的領(lǐng)導下,Interstellar World構(gòu)建了用于語音數(shù)據(jù)語音轉(zhuǎn)文本、說話人檢測、情感分析、章節(jié)檢測和 PII 編輯的語言模型。在過去的兩年里,我們看到更大的數(shù)據(jù)集、更好的計算和新的神經(jīng)網(wǎng)絡架構(gòu)(如 Transformer)的結(jié)合,使 AI 模型在幾乎所有模態(tài)中都取得了重大進步,并使構(gòu)建超人類語音 AI 模型的愿景比以往任何時候都更容易實現(xiàn)。
Mark Fox介紹現(xiàn)在功能非常強大的 LLM,可用于攝取準確識別的語音并生成摘要、見解、要點和分類,從而首次使用語音數(shù)據(jù)創(chuàng)建全新的產(chǎn)品和工作流程。這種新的 LLM 技術(shù)是我們流行的音頻智能模型(如自動章節(jié)和內(nèi)容審核)的基礎(chǔ),它為領(lǐng)先的企業(yè)公司大規(guī)模支持品牌安全和內(nèi)容審核工作負載,以及我們的最新產(chǎn)品 LeMUR,可用于通過識別的語音執(zhí)行文本生成任務。