產品介紹

Product introduction

DataExa-Kamala 自然語言處理平臺是淵亭科技自主研發的新一代產品。平臺基于成熟自然語言處理算法理論和少部分開源算法打造,并融合淵亭科技多年來在該領域的研究和積累。平臺通過數據資源管理、數據標注管理、算法管理、模型訓練管理、基礎服務組件、功能服務組件等模塊,為客戶供全棧的文本處理和挖掘工具平臺

核心技術

Product technology

  • 成熟的NLP能力持續升級工具(AIops)

  • 具有主動學習能力的數據標注工具

  • 內置大量自然語言處理預訓練模型

  • NLP模型一鍵發布 服務功能

  • 不同層級的算法組件滿足不同的自然語言處理需求

  • 前沿優秀技術方案的無縫集成能力

產品優勢

Product advantage

  • 全棧式自然語言處理

    提供一整套實現行業文本挖掘的方法論和工具集,涵蓋可視化數據標注、算法選擇、模型訓練全部環節
  • 深度學習與語言學深度結合

    基于最新深度學習技術和神經網絡,提取海量文本數據的潛在特征,同時結合語言學進行句法語義、篇章文檔等分析
  • 全面整合前沿優秀技術方案和數據集

    產品全面整合了各個應用場景下的優秀技術方案和數據集,包括BERT、PCNN+ATT、ULMFiT 等
  • 大規模降低人工標注工作

    運用主動學習技術,在少量標注樣本的情況下,進行 Fine Tune 即可提升模型訓練效果
  • 強大的自學習引擎

    產品內置了反饋系統收集使用信息,并自動轉存標注數據并進行模型重新訓練,達到“使用越久,精度越高”的自學習效果

客戶案例

Customer case

某銀行自然語言處理與智能問答系統
  • 客戶名稱:

    某四大行之一

  • 所屬行業:

    金融

  • 客戶痛點:

    客服問答只能解決高頻問題(依賴人工標注關鍵詞QA對);非結構化數據搜索結果范圍較大,無法精準問答

  • 應用成效:

    為客戶提供一個集日常問答、知識點抽取、知識圖譜生成、語義分析、智能分析等功能為一體的智能問答機器人系統。精確定位用戶所需要的提問知識,通過與系統用戶進行交互,為系統用戶提供個性化的信息服務

合作

文檔

江苏七位数预测精选5注