醫學自然語言處理系統
利用預訓練語言模型和下游任務微調技術實現醫療問答匹配、醫學文本信息抽取、醫學術語歸一化、醫學文本分類、醫學句子關系判定等任務。
預訓練模型中文GPT3
中文GPT3模型支持豐富的場景應用,在知識問答、知識檢索、知識推理、閱讀理解等文本生成領域表現突出。
利用國產深度學習MindSpore框架的自動混合并行模式,和1Tb中文數據集語料,利用大規模分布式訓練技術,訓練出超大參數中文預訓練模型中文GPT3。
Input上聯∶歡天喜地度佳節
Generate下聯∶花好月圓慶團圓
Input∶小紅是小明的姐姐,小紅的年紀比小明
Generate∶大
Input∶四川的省會是哪里
Generate∶成都,簡稱藝,別稱藝城、錦城、天府之國,是四川省省會、副省級市、特大城市、中國西部地區重要的中心城市、國家里要的現代制造業基地、西南地區綜合交通樞紐.
Input∶中國的四大發明有哪些?
Generate∶四大發明是∶造紙術、活字印刷術、火藥、指南針。
虛擬機器人聊天問答
利用計算機視覺、自然語言處理、機器學習方法實現虛擬聊天機器人。
實時檢測人臉在攝像頭面前出現,同時虛擬機器人打招呼
與人就日常聊天問答數據進行自然語言交流與溝通,聽懂人說的話,
然后做出合適的回應,發出相應的聲音
實現招手、舞蹈等動作,且說話時嘴型與文字可以匹配
虛擬機器人形象
多語言機器翻譯
利用預訓練語言模型技術和多任務學習技術,
實現中文、英文、法語、葡萄牙語等10種語言之間相互的翻譯的效果。
針對多樣化文本長度,語序變化,文本風格,罕見詞等,
達到了譯文通順,準確且自然的效果。