新聞資訊

聯系我們

微信圖片_20190327160602.jpg

宜昌百度公司

地址:宜昌市高新區大連路清華科技園


公司新聞
當前位置: 首頁 > 新聞資訊 > 公司新聞
百度大腦,“上新了”!

前不久,百度大腦推出了包括語音技術、視覺技術、自然語言處理、知識圖譜等在內的通用AI能力,以及開源深度學習框架方面的優化升級。與此同時,人工智能已經連續三年進入政府報告、“智能+”成為2019年行業的新命題。

雷鋒網了解到,百度大腦自2016年啟動開放以來,目前已經是服務規模大的AI開放平臺。共計開放了158項AI能力,24小時快速集成,開發者數量超過100萬。面向廣泛的企業和開發者提供先進、全面的AI能力,不斷降低AI應用落地的門檻。

語音方面

在今年1月的百度輸入法探索版發布會上,首次發布了領先國際的語音技術:在線語音領域全球首創的流式多級截斷注意力模型SMLT「Streaming trancated multi-layer attention」。值得注意的是,這是首次在大規模語音識別工業界采用注意力(attention)模型。

提升識別率的同時大幅優化了解碼速度。“語音識別極速版”,擁有更快的響應速度,相對識別準確度提升15%。此項語音能力在API調用方式下,實時率小于0.1,意味著5s的音頻不到500ms即可完成識別過程,減少了識別音頻所需的耗時,提升語音交互的響應體驗。

在近距離安靜環境下,識別準確率可達到98%,同時支持略帶口音、童聲、耳語的識別,使語音識別應用更加廣泛。多平臺的SDK也即將推出,使APP、服務器端更可實時識別,應用這一領先技術。目前,每個開發者賬戶將贈送5W次免費調用量,針對新能力的使用者,也即將推出一系列贈送及優惠活動。

同時,近場語音識別升級了預置語義解析。預置場景由35個升級為51個,包括天氣、航班、電話、電影播放、頁面屏幕控制、電視劇、美食、手機設置、通用錄、提醒、短信、故事等,語義解析效果全面優化,80%優于原有解析結果。

百度大腦稱以下新品也將推出,例如:語音識別自訓練平臺,支持自動評估選出最好的基線模型,僅上傳業務場景文本語料即可訓練語言模型,零代碼自助訓練專屬的語音識別模型,極大地方便語音開發者提升所在業務場景的識別準確率,滿足業務上的語音識別需求。

另外,遠場語音開發套件,可快速進行遠場識別開發評估,此套件應用于機器人、兒童故事機、家電、車載設備等硬件。同時還將開放離線合成,以及推出更多音庫。

視覺方面

首先,在OCR方面:

新增了卡證OCR 4個新能力:戶口本OCR、出生醫學證明OCR、港澳通行證OCR、臺灣通行證OCR,總數達到9種;

新增票據OCR 4個新能力:行程單OCR、保單識別OCR、通用機打發票OCR,定額發票OCR,總數達到9種;

汽車場景3個新能力:車輛VIN OCR、機動車銷售發票OCR、車輛合格證OCR,總數達到6種。這些OCR新能力在關鍵字段的準確率均在90%以上,并有多項是業界首次平臺化開放。至此,OCR產品全系列共34款,實現卡證、票據、文檔、汽車全場景覆蓋。

對已有的OCR能力也進行了功能升級:表格識別:支持合并單元格、無表格線等復雜樣式;iOCR 自定義模版文字識別:支持列寬不固定、有合并單元格的表格樣式的定制識別;駕駛證識別:支持駕駛證副頁的識別。


宜昌百度公司,讓企業輕松獲利!

地址:宜昌開發區大連路33號(清華科技園) 電話:15872560008 版權所有:(百度宜昌地區營銷中心 宜昌百度公司)

冰球突破豪华版的攻略
pk10人工1期计划在线 北京pk赛车官网下载赛 时时彩单双计划 江苏时时开奖视频 腾讯五分彩时时彩计划软件 必赢客pk10软件破解 排列三组六七码遗漏 球探体育比分 快三规律计划 北京pk10人工计划网页 ③肖默认版块 竟采比分网 跟计划如何防止连挂 牛牛怎么玩才能赢钱 东京时时彩一天多少期 mg游戏是指