云知聲鎖定IoT:AI獨角獸如何應對資本寒冬?
——專訪云知聲CEO黃�

【技術與研發】谷歌等開源平臺鑄劍,云知聲扎實落地苦練劍法
語音識別領域LSTM-CTC技術效果好,效率提�40%�
百度、訊飛、云知聲等各家企業技術路徑相似,差異在于針對不同場景優化不同細節�
【記者】和國際巨頭以及科大訊飛相比,云知聲的語音技術什么不同?
【黃偉】坦率來講,業內一線的公司包括Google、百度、科大訊飛等使用的技術都差不多。因為現在學術、技術層面的溝通是相對非常充分的。比如,語音識別領域,效果好的就是LSTM-CTC。以前用的統計模型,以幀來做優化單位,會糾纏到局部細節里,但LSTM-CTC以整句優化為目標,忽略一些中間細節,不糾纏于對幀的處理,解碼效率會提高很多。工業界看來,采用這種技術之后,語音識別的效率會比以前提�40%以上。云知聲近也剛剛做了引擎的升級,跟以前相比,語音識別平均的錯誤率下降�20%�40%,這些都是新技術帶來的幫助。無論百度、訊飛,還是我們,都可以follow前沿的技術,在技術路線方面不會有太大偏差。但不同在于,基于每家公司對算法的理解程度不一樣,加上面向的應用場景不同,針對不同場景的優化細節會不太一樣�
【記者】云知聲會不會采用例如Google開源的資源?
【黃偉】云知聲有些東西確實使用開源的資源,沒必要全部模塊自己寫。像Google、Facebook等,他們在鑄一把劍,我們來練劍法。但Google、Facebook開源的基本上是離線部分,我們拿來做模型訓練,它實際上是一個是開發工具,并不是一個商業產品。真正要上線的產品一定是靠自己寫的�
【記者】作為一家AI技術公司,云知聲的技術儲備如何?
【黃偉】硬件基礎設施上,我們在國內北京,上海、廣州和成都4個城市布有機房,今年新添置的GPU花費大概�200多萬,累計下來硬件研發上的花費有1�2千萬,不包括第三方服務。另外,我們也在逐步地使用一些第三方的服務,比如說阿里云,他們也逐漸開放了GPU的云服務資源�
人才方面,公司工程師占比78%,核心團隊博士占比超�45%。云知聲開始的創始人都跟我背景相近,CTO梁家恩是我以前盛大的同事,也是科大的師弟,另外幾個創始人,比如康恒以前也是一起共事過,基本都是從學術界到工業界一直在做這塊的。后面,我們也在不斷引入多元化人才加入,有很多海歸,不是說海歸一定比我們強,而是在這個領域里,需要中國跟美國的技術人才在一起,在國內產業格局理解和國際前沿跟蹤方面有個良好的呼應�
【記者】云知聲每年在研發上的經費有多少,占多大比例�
【黃偉】我們每年成本差不多幾千萬,研發投入占到總支出的70%�
【產品與業務】AllIn物聯網AI,投注車載、家居、醫療三大領�
IoT領域AI技術服務云知聲All-In,手機端非其業務重點。車載后裝、家居、醫療三領域為云知聲產品主要應用場景,目前幾乎無利潤�
產品服務激活量及其使用頻次是重點評價指標之一,生產合同簽訂和實際落地出貨量是關鍵指標之二�
【記者】云知聲的業務領域側重哪方面�
【黃偉】我們的定位是專注物聯網領域的人工智能服務,所以主要在IoT領域做優化,IoT領域的重點又集中在家居和車載兩方面,以及在這兩方面發展要整合的服務。比如,開車的時候,除了要對POI(pointofinterest)進行識別,用戶可能還有一些如歌曲娛樂、餐飲、加油站等周邊生活服務的需求,我們就要針對這些專門做優化;此外,IoT領域,很多場景跟硬件有關,我們不能只做云端識別,還要做一些本地的、甚至低功耗的,這也是我們優化的目標�
【記者】為什么會定位在IoT領域?與訊飛這樣的巨頭相比有什么差異?
【黃偉】云知聲�2012�9月開始做語音云平臺,發現了一些很有意義的數據:有一些用戶量很大的APP,其實語音使用的頻次并不多;反倒是一些硬件設備廠商,數量上雖然沒有軟件多,但語音的使用頻次很高。比如,今天樂視超級電視每天的語音激活幾乎是100%,每個用戶每天的語音使用頻次在幾十次以上,這是一個相對高頻的數字,但我們也會看到一些號稱用戶過億的APP,每天語音使用其實只�1%-2%。所以我們判斷語音并不是手機應用的剛需,再加上公司資源有限,所以從成立至今云知聲一直沒有在手機領域投入太多資源,而是專注在IoT領域�
我覺得我們和訊飛大的差異就在于定位不一樣。訊飛毋庸置疑是偉大的企業,是我師兄創立的公司,我對他非常尊敬。訊飛的主營業務,集中在教育、運營商、金融、政府領域,所以會側重把人力和資源投入到這些方面。另外,訊飛是一家上市公司,要關注資源投入和收益產出比。坦率來講,今天IoT的業務幾乎是賠本的,所以我們跟訊飛技術都很,但是為了讓客戶買單的話,技術優化目標不一樣,提供的service不一樣的,對客戶的服務水平也不一樣。整體而言就是資源投入上訊飛可能不會作為重點,但對云知聲來說IoT是ALLIN來做的事情,今天它的規模并不大,但我們更相信未來。不過,今年我們漸漸看到訊飛對這塊已經開始重視了�
【記者】云知聲目前在IoT領域的業務做得怎么樣?
【黃偉】IoT領域來講,云知聲應該是國內早落地的公司。去年IoT所有的語音收入幾乎是被我們拿的,差不多有幾千萬,今年可能會有幾個億,但總體來講市場規模并不大。我們是TOB的公司,站在客戶的身后,這方面對外界講得一直比較少,但比如說在汽車后裝車載市場,云知聲的車載語音交互方案已經有近百家合作客戶,市場占有率,大概�60%�70%�
【記者】為什么選擇后裝車載市場,又是如何挖掘這塊市場的?
【黃偉】我科大畢業后在摩托羅拉工作,后來加入盛大,在加入盛大之前還有大半年在Nuance工作,就是負責車載,對車載的市場了解比較多。車載前裝市場,測試周期很長,流程非常嚴格,一般需�3-5年,流程都走完后發現一款車的銷量其實很少。就像今天我們花100多萬去買一輛好車,但發現電子設備都很落后,因為那是幾年前定裝的。對一個初創企業來說,做前裝性價比不高�
- 全年征稿 / 資訊合作聯系郵箱�[email protected]
- 凡本網注�"來源:智能制造網"的所有作品,版權均屬于智能制造網,轉載請必須注明智能制造網,http://www.lfljgfsj.com。違反者本網將追究相關法律責任�
- 本網轉載并注明自其它來源的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品來源,并自負版權等法律責任�
- 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利�
- 01三豐精密量儀展示全球領先測量技�
在高端制造業快速發展的背景下,精密測量技術作為產業的“眼[詳細]
- 02從“原子”到算法!人工智能領域的“元
研究團隊發現,處于同一“主族“的算法(如支持向量機與核�[詳細]
- 03創新求變 看青山皮鞋“老樹”何以破局
培育一棵參天大樹,既要選好苗,更要精細澆灌。做好一雙經�[詳細]
- 047月,低空巨頭云集北京,共探無人機�
�2025國際無人機應用及防控大會”作為中國華北地區無人機及[詳細]
- 05賓利發布突破性人工智能皮革檢測技�
人工智能皮革檢測系統并不能完全取代賓利訓練有素的工匠的技[詳細]
- 06公開征集�3項強制性國家標準制修訂計劃項目的意�
現將申請立項的《電線電纜通用安全技術要求》等3項強制性國[詳細]
- 07關于征集4項電子視聽產品碳足跡核算團體標準編制組成員通知
在相關電子產品領域、生命周期評價領域或碳足跡領域從事生�[詳細]
- 082025新疆(昌吉)農業展覽會:科技賦能
2025新疆(昌吉)農業展覽會定�2025�8�6-8日在新疆農業博覽[詳細]
- 01人形機器人半馬的啟示:技術突破等正迎
周末剛結束的2025北京亦莊半程馬拉松暨人形機器人半程馬拉松[詳細]
- 02國產替代再下一城!20億基地劍指全球智
2024年全球導熱材料市場規模預計突�200億美元,�5G基站、A[詳細]
- 03人形機器人半馬前三出爐!天工Ultra奪冠
“天工Ultra”以2�40�42秒的成績沖線,奪得全球首個人形機[詳細]
- 04星旅遠洋郵輪“鼓浪嶼”號常駐香港運營
“鼓浪嶼”號是目前唯一一艘以香港為母港運營的郵輪,預計全[詳細]
- 05全光驅動計算機大突破:可編程芯片首次
美國賓夕法尼亞大學的研究團隊成功開發出了首款極具創新性的[詳細]
- 06《國家智能制造標準體系建設指南(2024 版)》印�
智能制造是基于先進制造技術與新一代信息技術深度融合,貫穿[詳細]
- 07一周趣評:新車裝載智能座艙滲透率�73%;抖音首次公開算法原�
2025�4�14�-4�20日,智能化座艙、算法、數據中心、移�[詳細]
- 08寧德時代首個超級科技日,正式開啟新能
寧德時代鈉新電池作為全球首款大規模量產的鈉離子電池,打破[詳細]
- 01霸王茶姬上市!成美股“中國茶飲第一�
中國茶飲品牌霸王茶姬正式在美國納斯達克上市,成為中國茶飲[詳細]
- 02關于征集人工智能領域國家標準起草單位
根據“國家標準化管理委員會下達的2024年第七批推薦性國家標[詳細]
- 03快訊|螞蟻集團和中國移動計劃投資宇樹科技
機器人獨角獸公司宇樹科技計劃引入新投資方,包括螞蟻集團和[詳細]
- 04零部件企業跨界具身智能,能掀起多大風
汽車零部件企業紛紛躬身入局,緊跟整車企業的步伐,毅然闖�[詳細]
- 05最“燒錢”的補能和芯片,蔚來扎進去�
從資本市場到圈內人士,對蔚來依舊堅持高研發投入,建設換電[詳細]
- 06世界最小無人機誕生:直徑不�1厘米�
這款飛行機器人堪稱目前世界上實現可控飛行的最小無線機器人[詳細]
- 07AI賦能制造業:邁向實時化與智能化的未
AI技術正在深刻改變制造業的生產方式和管理模式。本文將深入[詳細]
- 08全球首個跨本體協作框架問世!可支持�
RoboBrain已集成超百億參數的多模態大模型,支持對自然語言[詳細]