close

 

EDVVE79465BRFREF5ECE

 

內容簡介

  證嚴上人說:「時間可以造就人格;時間可以成就事業;也可以儲積功德;人生要為善競,分秒必爭;要學會過秒關-把握每一個當下!」

詳細資料

  • ISBN:9574492141
  • 叢書系列:
  • 規格:14 x 20 cm / 普通級 / 初版
  • 出版地:台灣
  • 本書分類:> >

 

 

達摩院成立兩年多,機器智能技術實驗室展示了一下成績。 2017 年 10 月,阿里成立了達摩院,覆蓋 5 個研究領域,建有 14 個實驗室。除了上述的「機器智能」,達摩院研究大方向還有數據計算、機器人、金融科技、X 實驗室。 ... 機器智能技術實驗室側重於 AI 相關技術的基礎研究,旗下設有語音實驗室、視覺實驗室、語言技術實驗室、決策職能實驗室、以及城市大腦實驗室。 近日,達摩院機器智能技術實驗室舉辦了一場小型媒體溝通會,幾位技術專家向外界介紹了最新成果和進展。 ... 兼具表現力和穩定性的語音合成技術 首先,機器智能技術實驗室正式發布了新的語音合成技術 KAN-TTS(KAN 指的是 Knowledge-Aware Neural)。TTS(Text-To-Speech,文本到語音)是一種將文字轉化成語音的技術,智能音箱、個人虛擬助理都需要這種技術支持。 達摩院機器智能語音實驗室高級算法專家雷鳴介紹,當前業界商用系統的合成語音與原始音頻錄音的接近程度,通常在85%到90%之間,而基於KAN-TTS技術的合成語音可將該數據提高到97%以上。 簡單來說,KAN-TTS 合成的語音更加像真人的語音,「接近真人韻律的感覺」。 ... 「我們新一代的 TTS 解決方案深度融合了傳統 TTS 和端到端 TTS,基於不同領域的深層 Knowledge。」雷鳴介紹道。 所謂端到端 TTS,即不依靠領域知識,基於強大的深度學習模型、海量數據來生成音頻,優勢是大大節省設計的工作,並且得到更加流暢、表現力更好的合成語音,但需要大量計算力支持,而且會出現丟字、漏字等不穩定的情況。Google 的 Tacotron 和 DeepMind 的 WaveNet 都是典型的端到端 TTS 模型。 而傳統 TTS 需要花費大量時間和精力去了解相關的領域知識,設計難度較高,但勝在合成的語音比較穩定。 通過將傳統 TTS 和端到端 TTS 的結合,KAN-TTS 結合了兩者的優勢,充分利用不同領域的深層 Knowledge,合成表現力和穩定性具佳的語音。 針對不同的需求,機器智能技術實驗室提供了「開箱即用」的 TTS 產品,覆蓋 5 大場景(通用場景、客服場景、童聲場景、英文場景和方言場景),具備 34 個高品質的聲音。 ... 除了「開箱即用」的聲音,達摩院這個語音合成方案還能讓專業用戶定製聲音。 傳統語音合成定製需要10小時以上的數據錄製和標註,對錄音人和錄音環境要求很高。「從啟動定製到最終交付,需要半年時間」。而達摩院利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結合的方法,將語音合成定製成本降低10倍以上,周期壓縮3倍以上。 也就是說,用1小時有效錄音數據和不到兩個月製作周期,就能完成一次標準 TTS 定製。 此外,普通用戶也可以自己定製「AI聲音」,只需手機錄音十分鐘,就能獲得與錄製聲音高度相似的合成語音。 ... 語音、自然語言、視覺各領域都有新成績 除了公布新語言合成方案,機器智能技術實驗室還亮出了新成績。 機器智能技術實驗室透露,阿里AI在國際頂級技術賽事上獲得了40多項世界第一,入選了近400篇國際頂會論文。具體到細分領域,機器智能技術實驗室最近都有不同建樹。 語音領域,2019年1月機器智能技術實驗室在國際頂級對話系統評測大賽(DSTC-7)上獲得雙料冠軍,將人機對話準確率的世界紀錄提升至94.1%,並於2019年7月開源了創造這一記錄背後的人機對話模型 ESIM。 事實,該算法模型提出了兩年多,已被包括谷歌、facebook在內的國際學術界在200多篇論文中引用。 ... 自然語言理解方面,機器智能技術實驗室在 6 月的 MS MARCO 文本閱讀理解挑戰賽中,擊敗了 Facebook和微軟,創造了閱讀理解能力測試的新紀錄,並在開放域問答任務上超越人類閱讀水平。 MS MARCO 挑戰賽是 AI 閱讀理解領域的權威比賽,參賽機構提供的 AI 模型需要在搜尋引擎返回的網頁文檔中,找出 100 萬個問題的正確答案。 阿里方面介紹,阿里 AI 模型的突破在於提出了基於 「融合結構化信息 BERT 模型」 的 「深度級聯機器閱讀模型」,可以模仿人類閱讀理解的過程,先對文檔進行快速瀏覽,判斷,然後針對相應段落進行精讀,並根據 「自己的理解」 回答問題。 達摩院機器翻譯技術團隊已實現了48個語言翻譯方向,支持俄、西、法、阿、土,泰、印尼、越南等多種語言翻譯,其中電商覆蓋了大部分語向和場景,超越了谷歌和亞馬遜,日調用量達到17.9億次。 ... 在機器視覺領域,機器智能技術實驗室在圖像搜索、大規模圖像識別、視頻分析、線下視覺智能等領域都有所建樹。其中,圖像搜索領域,阿里 AI 的向量引擎比Facebook快6倍。 機器智能技術實驗室在 6 月份剛剛結束的 WebVision 競賽中,阿里 AI 以 82.54% 的識別準確率,擊敗了全世界150多支參賽隊伍,獲得冠軍。機器智能技術實驗室稱,阿里 AI 目前可以識別超過 100 萬種物理實體。 WebVison 是目前圖像識別領域最權威的競賽之一,專注於物體識別,被譽為接棒 ImageNet 的大規模圖像識別競賽。 7 月,在CVPR2019舉辦的LPIRC(低功耗圖像識別挑戰賽)中,阿里AI獲得在線圖像分類任務第一名。在挑戰賽使用的訓練數據集上,阿里AI實現了67.4%的分類精度,比官方提供的基準線高3.5%。 值得注意的是,上述只是達摩院旗下機器智能技術實驗室的進展和成績。 本文圖片均來自於網絡,如有侵權,請聯繫作者刪除,謝謝!

 

 

 

 

 

文章來源取自於:

 

 

壹讀 https://read01.com/Gmd7OxO.html

博客來 https://www.books.com.tw/exep/assp.php/888words/products/0010355818

如有侵權,請來信告知,我們會立刻下架。

DMCA:dmca(at)kubonews.com

聯絡我們:contact(at)kubonews.com


神岡味覺異常看什麼科神岡心臟無力感治療中醫霧峰發燙感治療有效中醫診所
台中容易冒汗中醫推薦 龍井味覺異常治療有效中醫診所 最推薦的中醫診所豐原手抖中醫推薦 潭子強迫症看什麼科 這間中醫診所很大推霧峰胃脹中醫推薦 太平區情緒緊張改善中醫診所 當地人都推薦的中醫診所神岡腎臟功能異常治療中醫 南屯失眠中醫推薦 Dcard推薦的中醫診所

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 ulgo8zhckh 的頭像
    ulgo8zhckh

    ulgo8zhckh的部落格

    ulgo8zhckh 發表在 痞客邦 留言(0) 人氣()