2023-06-14
近日,ICDAR 2023多項賽事落下帷幕,來自CVTE中央研究院的文檔圖像分析與識別團隊喜提多項任務冠亞軍!
ICDAR(International Conference on Document Analysis and Recognition,國際文檔分析與識別會議)是文檔圖像分析領域最重要的國際會議之一。今年ICDAR設立了十余項競賽,吸引了來自谷歌、亞馬遜、百度、阿里、騰訊、北京大學、清華大學等諸多國內外頂級科技公司和知名高校參加。此次大賽中,CVTE團隊在BDVT-QA的端到端視頻文字識別任務中獲得第一名(V-DA),在CROHME手寫公式識別賽事的三項任務——在線公式識別(On-line recognition)、離線公式識別(Off-line recognition)、雙模態公式識別(Bimodal recognition)均獲得第二名(YP_OCR)。
·全國知識圖譜與語義計算大會 評測任務:面向音樂領域的命令理解任務(第3名,2018)
·阿里天池:“數智教育”數據可視化創新大賽(第1名,2019)
·ACM MM Challenge AI Meets Beauty(第3名,2019)
·阿里天池:第二屆海南大數據創新應用大賽-智能算法-簡歷解析賽(第5名,2020)
·2021 年訊飛 AI 開發者大賽-試題標簽預測挑戰賽(第2名,2021)
·CCL 2022漢語學習者文本糾錯競賽(賽道一第3名、賽道四第2名,2022)……
此外,中央研究院也會通過參賽對未來技術進行儲備和驗證,今年中央研究院數據挖掘團隊(CVTEDMer)參與了華為因果推理挑戰賽(PCIC),經過線上篩選和決賽答辯最終取得線上第1名、決賽答辯總成績第2名的好成績。本次參賽的模型可基于當前業務進行未來規劃,根據產品的使用情況預測故障、做好解決預案。
近些年來手勢控制依靠自然、高效、便捷的優勢不斷出現在各類操作應用中,消費者們尤其贊賞手勢隔空操作、不直接接觸物體的安全特性。中央研究院依靠研究優勢對手勢交互進行深度研發,力求應用在更多場景、領域、設備中,刷新人們對于多模態的交互體驗。視覺是人類的重要知覺——可以感知環境、識別手勢、辨別面部表情,進行眼動追蹤等,CVTE中央研究院視覺研究以“看清世界 看懂世界”為愿景,在醫學影像、3D場景感知、虛擬人、情感智能等垂直領域進行深度探索,致力打造更加多元化的視覺研究和應用。
在語音交互賽道,我們結合業務場景對拾音模塊進行深入研究,顯著提升課堂和會議場景下的音頻拾音質量;通過對語音識別和語義理解方向的研究實現了技術方案平臺化,可為各類智能終端設備提供更便捷且睿智的語音交互。
依托于中央研究院對于基礎技術及應用技術的深層次研究和實踐經驗,當前已在多個新興領域進行戰略孵化。我們寄望中央研究院的研究成果和創新思維在未來孵化出更多新興業務,培養新一代科學家、企業家。更廣的布局下我們也期待更多富有想象力和研究實力的小伙伴加入,壯大中央研究院,
通過科技孵化出更多業務,將夢想變成現實。
CVTE始終在積極營造進取、包容和開放的科研環境,緊跟前沿技術的趨勢,大力推進研究成果在未來教育、企業服務、智能硬件、健康醫療等領域的落地轉化,期待充分實現技術的產業價值和社會價值,CVTE也將繼續秉持科技創新賦能的信念,讓因我們的存在讓更多人事業有成,生活幸福的使命愈發鮮活。