<address id="pnrlx"></address>

<progress id="pnrlx"><track id="pnrlx"><ol id="pnrlx"></ol></track></progress>

<font id="pnrlx"></font>

<dl id="pnrlx"></dl>

抑郁癥診斷對話數據集生成方法、電子設備和存儲介質與流程

文檔序號:29648527發布日期:2022-04-13 22:04來源:國知局
抑郁癥診斷對話數據集生成方法、電子設備和存儲介質與流程

1.本發明涉及智能語音領域,尤其涉及一種抑郁癥診斷對話數據集生成方法、電子設備和存儲介質。


背景技術:

2.抑郁癥的影響廣泛,已經成為對全球生活預期的重大威脅。因此,抑郁癥的自動診斷方法已成為新的研究熱點。通過對話,可以從客觀的角度更好地了解患者的情緒和認知狀態,這與抑郁癥的診斷密切相關,同時可以提供情感支持。此外,對話系統可以為基于文本、語音和多模態的診斷方法提供可泛化的載體。通過詳細的對話標注可以有效增強診斷的可解釋性。因此,對話系統對于抑郁癥的大規模篩查和抑郁癥患者的定期回訪具有重要價值。
3.在實現本發明過程中,發明人發現相關技術中至少存在如下問題:
4.臨床診斷是一個復雜的過程,其目的是收集和總結一名患者的關鍵癥狀信息,同時提供類似聊天的對話體驗。在臨床實踐中,精神科醫生根據實踐經驗和多種診斷標準與患者進行溝通并提供診斷結果。這種抑郁癥的自動診斷模型需要患者和精神科醫生之間的大量對話。由于精神科醫療數據隱私保護,很難收集到真實患者和精神科醫生之間的大量對話。而其他領域的醫療對話并不能簡單修改轉用到抑郁癥診斷模型的訓練中,例如,網絡可以爬取到的關于軀體疾病的對話數據,軀體疾病的對話數據不能直接遷移到心理疾病,而用于心理咨詢的對話數據則缺乏一定的專業性,不能服務于診斷。


技術實現要素:

5.為了至少解決現有技術中難以從真實患者和精神科醫生之間獲取抑郁癥診斷對話數據,網絡爬取的對話數據缺乏專業性,不能用于抑郁癥的自動診斷模型訓練的問題。第一方面,本發明實施例提供一種抑郁癥診斷對話數據集生成方法,包括:
6.基于抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發起對話,生成所述真實人群的患者畫像;
7.基于所述患者畫像,模擬患者角色與醫生角色之間的抑郁門診對話記錄;
8.對所述抑郁門診對話記錄進行監督和過濾,得到達到臨床標準的抑郁癥診斷對話數據集。
9.第二方面,提供一種電子設備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行本發明權利要求1、2、6-8中實施例的抑郁癥診斷對話數據集生成方法的步驟。
10.第三方面,本發明實施例提供一種存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現本發明權利要求1、2、6-8中實施例的抑郁癥診斷對話數據集生成方法的步驟。
11.本發明實施例的有益效果在于:利用本方法收集的抑郁癥診斷對話數據集,對于研究端到端的抑郁癥問診對話,基于癥狀的抑郁癥診斷有十分重要的意義。而對話系統對于抑郁癥的大規模篩查和回訪也有十分重要的作用,能有效幫助緩解醫療資源不均衡造成的問題。
附圖說明
12.為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
13.圖1是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的流程圖;
14.圖2是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的三階段數據收集示意圖;
15.圖3是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的患者畫像的風險估計示意圖;
16.圖4是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的質量控制標準數據示意圖;
17.圖5是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的數據示意圖;
18.圖6是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的醫生診斷與患者畫像的一致性示意圖;
19.圖7是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的醫生對同一患者畫像的診斷一致性分析示意圖;
20.圖8是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的抑郁癥嚴重程度統計示意圖;
21.圖9是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的不同抑郁程度的癥狀摘要中最常見的詞分布示意圖;
22.圖10是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的主題統計示意圖;
23.圖11是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的主題轉換示意圖;
24.圖12是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的與相關數據集的比較示意圖;
25.圖13是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的回復生成和主題預測的評估結果示意圖;
26.圖14是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的對話框摘要任務的評估結果示意圖;
27.圖15是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的嚴重程度分類的評估結果示意圖;
28.圖16是本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的回復生成的人類評估結果示意圖;
29.圖17為本發明一實施例提供的一種抑郁癥診斷對話數據集生成的電子設備的實施例的結構示意圖。
具體實施方式
30.為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例?;诒景l明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
31.如圖1所示為本發明一實施例提供的一種抑郁癥診斷對話數據集生成方法的流程圖,包括如下步驟:
32.s11:基于抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發起對話,生成所述真實人群的患者畫像;
33.s12:基于所述患者畫像,模擬患者角色與醫生角色之間的抑郁門診對話記錄;
34.s13:對所述抑郁門診對話記錄進行監督和過濾,得到達到臨床標準的抑郁癥診斷對話數據集。
35.在本實施方式中,為了模仿現實的抑郁癥臨床咨詢場景,并涉及收集診斷對話的三個階段,如圖2所示。
36.對于步驟s11,為了模擬醫療記錄并且確保臨床對話的專業性,從抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發起對話,其中,抑郁癥診斷臨床標準包括臨床抑郁癥診斷標準icm-11和dsm-5,可以從這些標準中提取固定的問題向真實人群發起對話,由于這些問題都是由臨床抑郁癥診斷標準icm-11和dsm-5中固定提取的,所產生的對話都是有臨床抑郁癥診斷標準作為基礎,并且范圍可控,這種對話數據有著一定的專業性,可以引導真實人群表達出患者畫像的相應信息。而真實人群中包括抑郁癥患者,由于抑郁癥患者需要溝通,在與抑郁癥患者的溝通中,可以引導抑郁癥患者表達出某類抑郁癥患者存在的患者畫像信息,這個交互過程中,只采集某類抑郁癥患者存在的部分患者畫像,不采集交互的對話,因此也不會涉及到抑郁癥患者的隱私。
37.作為一種實施方式,所述基于抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發起對話,生成所述真實人群的患者畫像包括:
38.基于抑郁癥診斷臨床標準,利用基于狀態機的咨詢聊天機器人向包括抑郁癥患者的真實人群發起對話,生成所述真實人群的患者畫像,其中,所述患者畫像包括:患者人口學信息屬性以及至少包括情緒、興趣、精神狀態的診斷屬性。
39.在本實施方式中,由于目的僅為要采集患者畫像,不需要過于專業的抑郁癥鑒別,因此可以通過基于狀態機的咨詢聊天機器人來向包含抑郁癥患者的真實人群發起對話,減少了人工采集成本,也可以得到患者畫像。
40.為了克服獲取醫患保密協議涵蓋的患者病歷的不切實際,設計了一個基于狀態機的咨詢聊天機器人,它利用臨床標準中的固定問題來記錄每個用戶的抑郁癥狀和人口統計信息,如年齡、性別、婚姻狀況和職業。相應提示核心抑郁癥狀,包括情緒、興趣、精神狀態、
睡眠、食欲、社交功能和特殊傾向。邀請用戶簡明地回答,例如是/否回答和嚴重性估計。結合起來,獲得了一個自愿的、合法的抑郁癥畫像。如圖2所示,采集到患者的年齡、性別、婚姻、工作的人口學信息屬性,還可以采集到持續的情緒低落、興趣低下、注意力難以集中、缺乏自信心的抑郁癥診斷臨床標準的臨床屬性。
41.根據每個患者畫像的臨床標準icd-11和dsm-5估計抑郁發作的嚴重程度和自殺風險,結果如圖3所示?!翱煽亍北硎緹o風險,“輕度”、“中度”和“重度”表示風險的嚴重程度。示例的,68位患者畫像提供者報告說他們在授權診所被診斷出患有抑郁癥。在這些提供者中,53人目前正在經歷抑郁發作。
42.對于步驟s12,在步驟s11中,可以采集到各種抑郁癥的患者畫像,利用這些患者畫像,可以模擬出各種類型的抑郁癥模擬患者角色,通過模擬患者角色與模擬醫生角色直接進行模擬的心理咨詢對話,這樣,就可以得到抑郁門診對話記錄,為了保證咨詢對話的數量、質量和專業性。
43.在精神科醫生的指導下,根據真實抑郁癥患者的自我報告進行了對話模擬。特別是,首先收集了少量真實場景中醫生和患者之間的對話?;谏鲜鱿葲Q條件和臨床抑郁癥診斷標準icd-11和dsm-5,向模擬工作者發布了模擬任務。整個流程是這樣的:(1)設計與培訓:人工先經過專業培訓,然后分為醫生和病人角色;(2)注解:在對話過程中,要求他們對主題/癥狀轉換進行注解;(3)同伴評價:醫生和患者角色在對話后從多個維度相互評價。
44.作為一種實施方式,所述模擬患者角色與醫生角色之間的抑郁門診對話記錄包括:
45.基于所述患者畫像,利用第一工人模擬患者角色進行與模擬醫生角色之間的表達對于事件的內心感受;
46.基于抑郁癥診斷臨床標準,利用第二工人模擬所述醫生角色向所述患者角色詢問與所述抑郁癥診斷臨床標準相關的事件,并提供標注,其中,所述標注包括所述抑郁門診對話記錄的對話主題。
47.在本實施方式中,對于模擬患者角色,大多數有耐心的工人都沒有抑郁,讓這些工人作為扮演病人的演員。為了幫助他們了解患者畫像中的癥狀,提供了患者畫像中癥狀的詳細解釋,包括嚴重程度和持續時間,以及一些患者的自我報告,以幫助他們了解患者的內心感受。根據準確表達的癥狀,他們需要自我想象患者畫像提供者可能發生的生活事件,并與醫生交談,以表達患者在講述事件過程中的內心感受。
48.對于模擬醫生角色,邀請精神科醫生和臨床心理治療師與實際的抑郁癥患者進行會診對話,從中收集參考對話。然后根據他們的詢問,結合icd-11和dsm-5,匯編了醫生在診斷時需要知道的信息。模擬醫生角色的演員需要在與模擬患者角色的談話中獲得足夠的信息,并在模擬患者角色向他們傾訴他們正在經歷的事情時同情和安撫他們。在談話結束時,他們需要提醒可能出現抑郁癥的患者及時就醫。
49.其中,對話主題的標注根據臨床標準涵蓋的核心癥狀,將主題分為情緒、興趣、精神狀態、睡眠、食欲、軀體癥狀、社會功能、自殺傾向和篩查。值得注意的是,將共情安慰列為一個特殊主題,因為它是臨床實踐中的重要組成部分。模擬醫生角色的演員被要求在聊天期間標注他們的對話記錄的主題(上述說明的情緒、興趣

篩查)。通過上述步驟,獲得了保證咨詢對話的數量、質量和專業性的抑郁門診對話記錄。
50.對于步驟s13,由于在步驟s12所獲得的抑郁門診對話記錄,還是模擬的,可能存在一些不達標(不標準、錯誤)的抑郁門診對話。為了濾除沒有達到臨床標準的抑郁門診對話會對獲得的抑郁門診對話記錄進行監督和過濾。
51.作為一種實施方式,利用專業精神科醫生對所述抑郁門診對話記錄進行監督,獲取所述專業精神科醫生對所述抑郁門診對話記錄的專業評估;
52.獲取所述模擬患者角色與醫生角色相互的角色表現評估;
53.基于所述專業評估、所述角色表現評估以及所述抑郁門診對話記錄的對話長度對所述抑郁門診對話記錄進行過濾。
54.所述患者角色評估包括:由所述患者角色配對的模擬醫生角色評估的對話的自然程度、敘述的一致性,以及由專業精神科醫生評估的患者畫像中癥狀的嚴重程度與表達的匹配程度;
55.所述醫生角色評估包括:由所述醫生角色配對的所述患者角色評估的醫生相似度以及由所述醫療人員評估的醫生相似度。
56.在本實施方式中,獲得演員的角色表現評估,在抑郁門診對話結束后,模擬患者角色的演員和模擬醫生角色演員還會相互打分,來評判對方是否進入了其對應的角色,是否表達出抑郁癥患者的特征或醫生的職業水平。
57.患者角色評估,從三個維度評估患者角色的任務表現:表達的自然程度、敘述的一致性以及所描述癥狀的嚴重程度與表達的匹配程度(例如說話是否自然,對于某件事情前后敘述是否一致,患者畫像中記錄的抑郁癥情況患者角色是否表現了出來)。前兩個分數由對話中的另一個參與者給出,第三個分數由檢查對話的醫療專業人員給出。
58.醫生角色評估,通過演員與真正醫生的相似程度來評估醫生任務的完成情況。該程度分別由對話的患者角色和專業醫生進行評估。
59.為確保符合臨床方案,進一步邀請專業精神科醫生和臨床心理治療師進行對話評估。他們篩選滿足診斷需求的對話,并提供精神病學診斷結果和癥狀總結。他們用真實場景的相似度分別對模擬醫生角色和模擬患者角色進行評分。
60.為了更好的培訓目的,采用多種范式進行質量檢查。對對話長度(抑郁門診對話記錄的對話長度、醫生每次對話的平均話語長度)、演員相互評分和精神科醫生給出的評分設置了最小限制,如圖4所示,*代表醫生提供,不合格的對話被排除在外。
61.最終,通過上述步驟總共收集了4428條對話,經過嚴格的質量篩選,最終保留了1339條(30%)抑郁癥診斷對話數據集。利用這些達到臨床標準的抑郁癥診斷對話數據集訓練抑郁癥的自動診斷模型,來進行自動的抑郁癥診斷,隨著確保質量和專業性的抑郁門診對話不斷的生成,所訓練的抑郁癥的自動診斷模型也會越來越精準。
62.通過該實施方式可以看出,利用本方法收集的抑郁癥診斷對話數據集,對于研究端到端的抑郁癥問診對話,基于癥狀的抑郁癥診斷有十分重要的意義。而對話系統對于抑郁癥的大規模篩查和回訪也有十分重要的作用,能有效幫助緩解醫療資源不均衡造成的問題。
63.作為一種實施方式,在本實施例中,所述模擬患者角色與醫生角色之間的抑郁門診對話記錄還包括:
64.利用基于所述患者畫像訓練的模擬患者機器人;
65.利用采集專業精神科醫生的對話訓練的模擬醫生機器人;
66.基于所述模擬患者機器人與所述模擬醫生機器人交互生成抑郁門診對話記錄,以及相互的角色表現評估。
67.利用模擬醫生機器人,通過抑郁癥診斷臨床標準對所述抑郁門診對話記錄進行模擬醫生評估;
68.通過角色表現評估、模擬醫生評估以及抑郁門診對話記錄對話長度對所述抑郁門診對話記錄進行過濾。
69.在本實施方式中,考慮到人工智能的進步,利用每個人的患者畫像構建不同患者不同癥狀的神經網絡,再利用知識圖譜進行擴充延伸,生成同一抑郁癥狀但性格不同的多種模擬患者機器人。
70.例如,在證券公司上班,通過知識圖譜,可以聯想到事業心較強的性格、溝通較強的性格。這樣,一個患者畫像可以模擬出多種不同人格的同一抑郁癥狀的多種模擬患者機器人。在模擬患者角色這端,也就可以生成更豐富的對話。
71.對于模擬的醫生機器人,專業精神科醫生的與抑郁癥患者的對話中,每句話都是有一定的意圖,并且某種問題也是有專業的醫學理論支持,和對于該問題的診斷。通過采集這些專業精神科醫生的對話訓練的模擬醫生機器人。這樣,在模擬醫生角色這端,可以發出某類抑郁癥特征的問題,并且對于抑郁癥狀給出適當的診斷結果。
72.由于該部分的抑郁門診對話記錄也是模擬生成的,也是需要監督和過濾的。此時,由于都是訓練的機器人,角色表現評估也就是雙方的對話是否通順、符合邏輯。例如,模擬醫生機器人提出問題后,模擬患者機器人反饋的內容中,模擬醫生機器人無法從反饋的內容中提取到問題的答案,從模擬醫生機器人的角度來說,對模擬患者機器人的評估較差。相反的,如果模擬患者機器人提出的內容,模擬醫生機器人并沒有基于與該內容相關的內容進行提問或解答(也就是模擬醫生機器人反饋的內容中提取不到模擬患者機器人提出的內容的關鍵詞),這樣模擬患者機器人和模擬醫生機器人可以相互進行評估。再利用訓練的模擬的醫生機器人重新對整段對話進行判斷,和對話長度進行綜合判斷,得到過濾的抑郁癥診斷對話數據集。隨著各類數據的不斷采集,對模擬醫生機器人、模擬患者機器人的不斷訓練,也就可以得到更多的達到臨床標準的抑郁癥診斷對話數據集。
73.對本方法進行試驗說明,數據集的整體統計數據如圖5所示。正如在這樣的診斷場景中所見,需要足夠的對話輪次:診斷對話表現出平均。每次對話21.6回合。精神科醫生提供的癥狀摘要平均達到83.1個單詞。這些統計數據明顯長于以前的相關數據集,表明診斷對話任務與其不同的數據要求存在差異。
74.需要注意的是,對話數據中模擬的癥狀是基于真實人群的畫像。為了驗證模擬對話確實反映了患者畫像中的癥狀,并從此類對話中得出有效的診斷結論,分析了患者畫像與精神科醫生癥狀總結的相應內容的一致性,以及一致性不同醫生對同一畫像的診斷結果。
75.人像診斷一致性,患者畫像包含抑郁癥狀,模擬患者角色的演員在此基礎上在實際描述中添加了更多細節,從而導致診斷摘要涵蓋更多內容。因此,利用醫生診斷總結的命中率(如圖6所示)來衡量一致性??梢钥闯?,大多數診斷的準確率很高,平均為86.1%,證明了患者模仿的真實性和總結的全面性。此外,還請精神科醫生對患者表達與癥狀嚴重程度
的匹配程度進行評分,平均3.9分,總分5分,即符合程度達到78%。
76.醫生的一致性,來自不同醫生的同一患者畫像的診斷結果可能略有不同。對于圖7所示的三個指標,計算了不同人像標準推導的平均值(排除了單獨診斷的人像),表明診斷結果的一致性較高,受工人主觀性影響較小。
77.在如圖8所示中展示了不同嚴重程度的抑郁癥患者的統計數據。隨著抑郁癥嚴重程度的提高,由于醫生對特定主題的更深入的提問,輪次和對話長度變得更長。診斷摘要中的內容變得更長以列出更多的抑郁癥狀。
78.最常見的話題也會隨著嚴重程度的變化而變化:“自殺傾向”在較嚴重的患者中更有可能受到質疑。
79.如圖9中,觀察到不同嚴重程度的診斷摘要中的熱詞存在很大差異。如(a)所示,患者大多有淺層癥狀,如決策困難和信心下降,通常存在于健康人群中。隨著病情的惡化,睡眠困難等更明顯的癥狀會頻繁出現,醫生會建議患者及時采取措施。在最嚴重的患者中,自殺風險和絕望在圖表(d)中變得頻繁。
80.不同話題的特征統計見如圖10所示。核心抑郁癥狀占談話的68.3%,其次是共情安慰,占23.1%。通過對首次出現的話題進行分析,可以看到,像情緒、興趣這樣的輕微癥狀通常在開始時被詢問,逐漸轉向自殺和軀體癥狀,這些癥狀通常是重癥患者所經歷的。這與臨床實踐相呼應,咨詢遵循漸進深入的方式。
81.圖11說明了對話主題轉換過程。與其他常見的話題很少跨越一回合的對話不同,診斷話題總是跨回合出現。由于抑郁癥診斷場景的特殊性,共情安慰在所有階段都保持穩定的比率。由于其敏感性,自殺風險通常在較晚的階段進行,其中,core代表核心,empathy代表共情,suicide代表自殺風險,behavior代表習性,screening代表篩選。
82.介紹相關數據集并與提出的診斷數據集進行比較,如圖12所示。抑郁癥診斷需要通過更多的對話輪次、更長的時間進行精確的癥狀信息收集話語權,以及足夠的情感支持。
83.面向任務的對話數據集是對話系統研究中最重要的組成部分之一,由為此目的的各種數據集組成,即multiwoz、msr-e2e、camrest、frames(以上四種都是現有的數據集)。然而,這些對話數據集針對的是生活中的常見場景。因此,對話輪次很少。而且,很少關注用戶的情緒,在對話中同情或安慰他們。
84.心理咨詢數據集與心理健康相關的對話研究已經解決了對話過程中的情緒并試圖激勵用戶。像esconv這樣的網絡開始關注情感支持對話系統。然而,他們主要關心的是為患者提供鼓勵和建議,而不是提供專業的診斷建議。
85.有一些針對診斷的醫學對話數據集,例如meddg和meddialog。然而,這些主要集中在軀體癥狀和軀體疾病上。meddialog雖然有少量的精神病數據,但缺乏專業的標注,不能用于抑郁癥診斷對話系統。此外,抑郁癥的診斷過程與軀體疾病的診斷過程有很大不同。根據icd-11(世界衛生組織),除了軀體癥狀外,患者往往還有情緒、興趣、精神狀態、社會功能障礙等多個維度的癥狀。出于這個原因,精神科醫生需要全面的信息來提供是準確的診斷的診斷,因此對話將屬于并包含多個知識領域。
86.一些對話數據集與抑郁癥密切相關,例如多模態數據集daic-woz。該數據集由采訪者和患有抑郁癥、焦慮癥等的患者之間的面對面咨詢對話組成,研究人員用這些對話來診斷抑郁癥。然而,該數據集只有189個對話,這對于對話生成任務來說是不夠的。
87.為了試驗對比了幾種模型,transformer是序列到序列模型進行回復生成和主題預測實驗。使用的實現是huggingface。這些參數是從在中醫對話數據集meddialog上預訓練的轉換器加載的。bart是一個去噪序列到序列預訓練模型,它是文本生成和摘要任務的入門模型。出于這個原因,使用在中文數據集上訓練的bart數據集來執行回復生成和對話摘要任務。
88.cpt是一種新穎的中文預訓練不平衡變壓器模型,不僅在生成任務中有效,而且具有強大的分類能力,因此選擇它作為骨干模型來進行生成任務,并將其分類任務的性能與bart進行比較。
89.bert有效地用于廣泛的語言理解任務,例如問答和語言推理。因此,使用在中文數據集上預訓練的version2來執行分類任務。
90.使用客觀指標評估回復生成任務和對話摘要任務,包括bleu2、rouge-l、meteor來衡量模型生成的回復和標簽之間的相似性。為了顯示代的多樣性,計算了dist-2。實現jieba3進行標記化并計算單詞級別的度量。
91.回復生成任務的結果如圖13所示??梢缘贸鋈齻€觀察結果:
92.(1)bart和cpt在本方法生成的數據集上表現出相似的生成性能;
93.(2)兩個模型大部分輸出執行transformer,它是在醫學語料上預訓練的,表明抑郁癥診斷不同于傳統的以軀體為導向的醫學對話;
94.(3)給定黃金主題,可以進一步提升生成性能。
95.主題預測準確率結果顯示為主題。在如圖13中觀察到類似的趨勢:bart≈cpt》transformer。由于十個主題是根據核心癥狀和情感支持進行分類的,抑郁癥診斷對話的不確定性和語言歧義無疑增加了預測難度。
96.對話摘要的結果列在圖14中,就n-gram與人類參考文獻的重疊而言,cpt與bart相當。盡管如此,cpt表現出更高的dist-2分數,表明其在世代多樣性上的優勢。
97.嚴重性分類二進制和4級分類通過平均加權精度、召回率和f1進行評估,如圖15所示。
98.為了更好地評估模型生成的回復的性能,雇傭15名工作人員來對由bart和cpt生成的回復和醫生的真實回復分別進行評分。為每個模型隨機選擇了100個來自不同主題的回復,讓3個工人從4個方面評估相同的回復:流暢度衡量生成句子的流暢度;合理性衡量基于對話歷史給出此回復的合理程度;醫生的相似度衡量反應與醫生的話的相似程度;舒適度衡量響應的舒適程度。評價結果如圖16所示。一般情況下,人工評價是根據客觀衡量的:cpt和bart表現出相似的表現,但都落后于基本事實。關于詳細的人工評估指標,兩種模型都可以生成流暢的回復。然而,為了產生合理的、令人欣慰的和醫生般的反響。
99.總的來說,本方法構建了一個符合臨床標準的抑郁癥診斷數據集,其中包含1339次對話以及精神科醫生的診斷摘要。此外,使用最先進的模型對多項任務進行實驗驗證,并將結果與客觀和人工評估進行比較。模型可以生成流暢且類似人類的回復。
100.本發明實施例還提供了一種非易失性計算機存儲介質,計算機存儲介質存儲有計算機可執行指令,該計算機可執行指令可執行上述權利要求1、2、6-8實施例中的抑郁癥診斷對話數據集生成方法;
101.作為一種實施方式,本發明的非易失性計算機存儲介質存儲有計算機可執行指
令,計算機可執行指令設置為:
102.基于抑郁癥診斷臨床標準,向包括抑郁癥患者的真實人群發起對話,生成所述真實人群的患者畫像;
103.基于所述患者畫像,模擬患者角色與醫生角色之間的抑郁門診對話記錄;
104.對所述抑郁門診對話記錄進行監督和過濾,得到達到臨床標準的抑郁癥診斷對話數據集。
105.作為一種非易失性計算機可讀存儲介質,可用于存儲非易失性軟件程序、非易失性計算機可執行程序以及模塊,如本發明實施例中的方法對應的程序指令/模塊。一個或者多個程序指令存儲在非易失性計算機可讀存儲介質中,當被處理器執行時,執行上述權利要求1、2、6-8實施例中的抑郁癥診斷對話數據集生成方法。
106.圖17是本技術另一實施例提供的抑郁癥診斷對話數據集生成方法的電子設備的硬件結構示意圖,如圖17所示,該設備包括:
107.一個或多個處理器1710以及存儲器1720,圖17中以一個處理器1710為例。抑郁癥診斷對話數據集生成方法的設備還可以包括:輸入裝置1730和輸出裝置1740。
108.處理器1710、存儲器1720、輸入裝置1730和輸出裝置1740可以通過總線或者其他方式連接,圖17中以通過總線連接為例。
109.存儲器1720作為一種非易失性計算機可讀存儲介質,可用于存儲非易失性軟件程序、非易失性計算機可執行程序以及模塊,如本技術實施例中的抑郁癥診斷對話數據集生成方法對應的程序指令/模塊。處理器1710通過運行存儲在存儲器1720中的非易失性軟件程序、指令以及模塊,從而執行服務器的各種功能應用以及數據處理,即實現上述方法實施例抑郁癥診斷對話數據集生成方法。
110.存儲器1720可以包括存儲程序區和存儲數據區,其中,存儲程序區可存儲操作系統、至少一個功能所需要的應用程序;存儲數據區可存儲數據等。此外,存儲器1720可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他非易失性固態存儲器件。在一些實施例中,存儲器1720可選包括相對于處理器1710遠程設置的存儲器,這些遠程存儲器可以通過網絡連接至移動裝置。上述網絡的實例包括但不限于互聯網、企業內部網、局域網、移動通信網及其組合。
111.輸入裝置1730可接收輸入的數字或字符信息。輸出裝置1740可包括顯示屏等顯示設備。
112.所述一個或者多個模塊存儲在所述存儲器1720中,當被所述一個或者多個處理器1710執行時,執行上述任意方法實施例中的抑郁癥診斷對話數據集生成方法。
113.上述產品可執行本技術實施例所提供的方法,具備執行方法相應的功能模塊和有益效果。未在本實施例中詳盡描述的技術細節,可參見本技術實施例所提供的方法。
114.非易失性計算機可讀存儲介質可以包括存儲程序區和存儲數據區,其中,存儲程序區可存儲操作系統、至少一個功能所需要的應用程序;存儲數據區可存儲根據裝置的使用所創建的數據等。此外,非易失性計算機可讀存儲介質可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他非易失性固態存儲器件。在一些實施例中,非易失性計算機可讀存儲介質可選包括相對于處理器遠程設置的存儲器,這些遠程存儲器可以通過網絡連接至裝置。上述網絡的實例包括但不限于互聯
網、企業內部網、局域網、移動通信網及其組合。
115.本發明實施例還提供一種電子設備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行本發明任一實施例的抑郁癥診斷對話數據集生成方法的步驟。
116.本技術實施例的電子設備以多種形式存在,包括但不限于:
117.(1)移動通信設備:這類設備的特點是具備移動通信功能,并且以提供話音、數據通信為主要目標。這類終端包括:智能手機、多媒體手機、功能性手機,以及低端手機等。
118.(2)超移動個人計算機設備:這類設備屬于個人計算機的范疇,有計算和處理功能,一般也具備移動上網特性。這類終端包括:pda、mid和umpc設備等,例如平板電腦。
119.(3)便攜式娛樂設備:這類設備可以顯示和播放多媒體內容。該類設備包括:音頻、視頻播放器,掌上游戲機,電子書,以及智能玩具和便攜式車載導航設備。
120.(4)其他具有數據處理功能的電子裝置。
121.在本文中,諸如第一和第二等之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關系或者順序。而且,術語“包括”、“包含”,不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括
……”
限定的要素,并不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
122.以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上??梢愿鶕嶋H的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性的勞動的情況下,即可以理解并實施。
123.通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到各實施方式可借助軟件加必需的通用硬件平臺的方式來實現,當然也可以通過硬件?;谶@樣的理解,上述技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品可以存儲在計算機可讀存儲介質中,如rom/ram、磁碟、光盤等,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執行各個實施例或者實施例的某些部分所述的方法。
124.最后應說明的是:以上實施例僅用以說明本發明的技術方案,而非對其限制;盡管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發明各實施例技術方案的精神和范圍。
當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1