當前位置:網站首頁>北大、加州伯克利大學等聯合| Domain-Adaptive Text Classification with Structured Knowledge from Unlabeled Data(基於未標記數據的結構化知識的領域自適應文本分類)
北大、加州伯克利大學等聯合| Domain-Adaptive Text Classification with Structured Knowledge from Unlabeled Data(基於未標記數據的結構化知識的領域自適應文本分類)
2022-06-23 21:52:40【智源社區】
作者:Tian Li,Xiang Chen,Zhen Dong等
簡介:領域自適應文本分類是大規模預訓練的一個具有挑戰性的問題語言模型,因為它們通常需要昂貴的附加標記數據來適應新領域。現有作品通常無法利用跨域單詞之間的隱含關系。在本文中,作者提出了一種新方法,稱為結構化知識域適應 (DASK),通過利用詞級語義關系來增强域適應。DASK 首先構建一個知識圖譜來捕獲目標域中的主幹詞(與領域無關的詞)和非主幹詞之間的關系。然後在訓練期間,DASK 將與樞軸相關的知識圖譜信息注入到源域文本中。對於下遊任務,這些知識注入文本被輸入到能够處理知識注入文本數據的 BERT 變體中。感謝知識注入,作者的模型根據與樞軸的關系為非樞軸學習域不變特征。DASK 在使用偽標簽訓練期間通過候選樞軸的極性分數動態推斷,確保樞軸具有域不變的行為。作者在廣泛的跨域情感分類任務上驗證了 DASK,並觀察到 20 個不同域對的基線絕對性能提昇高達 2.9%。代碼將在 https://github.com/hikaru-nara/DASK 上提供。
論文下載:https://arxiv.org/pdf/2206.09591.pdf
版權聲明
本文為[智源社區]所創,轉載請帶上原文鏈接,感謝
https://cht.chowdera.com/2022/174/202206232132470077.html
邊欄推薦
猜你喜歡
隨機推薦
- Day_04 傳智健康項目-預約管理-套餐管理
- 百度URL參數之LINK?URL參數加密解密研究(代碼實例)
- haas506 2.0開發教程-高級組件庫-modem.sms(僅支持2.2以上版本)
- 【畢業季·進擊的技術er】自己的選擇,跪著也要走
- MySQL重做日志 redo log
- 快速排序 + 冒泡排序 + 插入排序 + 選擇排序
- Acwing第 56 場周賽【完結】
- vtk.js鼠標左鍵滑動改變窗比特和窗寬
- aquatone工具 中的2個bug修複
- Vulnhub | DC: 4 |【實戰】
- 6月《中國數據庫行業分析報告》發布!智能風起,列存更生
- node request模塊cookie使用
- ionic5錶單輸入框和單選按鈕
- [極客大挑戰 2019]HardSQL
- 高性能算力中心 — NVMe/NVMe-oF — NVMe-oF Overview
- 基於STM32設計的寵物投喂器
- 圖片存儲--引用
- Tensorrt筆記(四)推理分割模型
- DevEco Device Tool 助力OpenHarmony設備開發
- 華為雲如何實現實時音視頻全球低時延網絡架構
- 你真的理解LDO的輸出電容嗎!?
- 二維激光SLAM( 使用Laser Scan Matcher )
- MySQL使用ReplicationConnection導致的連接失效分析與解决
- Go寫文件的權限 WriteFile(filename, data, 0644)?
- 在線文本過濾小於指定長度工具
- quartus調用&設計D觸發器——仿真&時序波驗證
- 【深入理解TcaplusDB技術】TcaplusDB構造數據
- 等保備案是什麼意思?應該去哪裏辦理備案?
- 建議自查!MySQL驅動Bug引發的事務不回滾問題,也許你正面臨該風險!
- 百萬獎金等你來拿,首届中國元宇宙創新應用大賽聯合創業黑馬火熱招募中!
- 力扣解法匯總513-找樹左下角的值
- 快速排序的簡單理解
- 139. 單詞拆分
- Web篇_01 了解web開發
- ADB 按鍵名、按鍵代碼數字、按鍵說明對照錶
- leetcode:面試題 08.13. 堆箱子【自頂而下的dfs + memory or 自底而上的排序 + dp】
- 解答02:Smith圓為什麼能“上感下容 左串右並”?
- MySQL的 安裝、配置、卸載
- 【ESP8266-01s】獲取天氣,城市,北京時間
- Redis 集群