為什麼我們需要有缺陷的聊天機器人

Kevin Chang
9 min readOct 28, 2019
這篇分享簡要地描述了我們在CHI Conference 2019發表的研究論文-
《Caring for Vincent: a chatbot for self-compassion》
旨在研究兩種相反互動類型的治療型聊天機器人對於心理健康-自我疼惜(Self-Compassion)的影響力。
現今的聊天機器人仍局限在單方面的關心使用者並聚焦在解決心理問題;我們試著打造出一個需要被關心的聊天機器人-Vincent,並比較這兩種互動方式如何影響使用者的心理健康。最後發現兩者都能提升用戶的健康心理,然而僅有需要受測者關心的Vincent,它的影響力能讓心理健康達到顯著成長。

聊天機器人的應用行之有年。在生活中,訂票、訂餐、客服詢問都能找到它們的身影。

KLM Messenger Chatbot

不過聊天機器人除了能幫助我們完成生活上的任務外,某些機器人更是為了幫助我們去解決心理疾病而設計出來。

Woebot — Your charming robot friend who is ready to listen, 24/7

🔎前期研究發展

在文獻探討的階段,先了解目前的聊天機器人都有什麼樣的設計。我們注意到治療型聊天機器人(therapist chatbot)的互動方式一直以來僅有主動關心(care-giving)使用者,這不禁讓我們好奇,如果設計需要被關心(care-receiving)的機器人,使用者又會又什麼反應呢?

設計一個會犯錯的機器人

「施比受更有福」

過去的互動設計聚焦在使用者可以為自己做些什麼,忽略了讓使用者為他人做些什麼,我們認為這樣的人機互動也能為使用者帶來正面的影響。

「預防勝於治療」

過去的治療型機器人的研究著重在診斷、解決特定的心理症狀(憂鬱、過度壓力…等);我們想透過新的互動設計,去研究是否有辦法強化使用者的心理健康。不只讓他們克服現況,更是讓他們有健康的心理去面對未來可能會遇到的各種挫折。

健康的心理-自我疼惜 Self-Compassion

當我們為他人著想的時候,間接的也提升了對自我疼惜的行為

嚴以律己是在現今社會中被大家所推崇的態度,但過度的自我批判與質疑自己的能力,往往讓自己籠罩在壓力之中。所謂的自我疼惜不是逃避,而是用溫和的態度去審視自己、勉勵自己。

我們用Self-Compassion指數做依據,去判斷使用者和Vincent互動一段時間後,這個指數是否能顯著成長。

這個階段的研究審視了目前治療型聊天機器人的設計,找到了一些還缺漏的領域值得深入探討,藉此擬定了新的研究假設。

🔎研究假設

我們設計兩種互動模式相反的機器人-Vincent去測試哪一種對受測者的Self-Compassion影響最大。

📒假設1:需要被關心的Vincent (Care-Receiving)可以讓使用者提升 self-compassion.

需要被關心的Vincent

📒假設2:會主動關心的Vincent (Care-Giving)可以讓使用者提升self-compassion.

給予關心的Vincent

📝實驗設計

實驗架構

我們隨機將受測者分成兩組,在兩周的時間,一組會與CR Vincent(需要被關心型)互動,另一組則是與CG Vincent(主動關心型)互動。受測者在實驗開始前與結束後都會填寫一份問卷,用以量化他們當下的self-compassion指數。

聊天機器人設計

我們在Google Dialogflow上編輯對話腳本,將界面架設在Facebook Messenger上,確保受測者都能方便地透過手機、平板電腦等媒介與Vincnet互動。

Care-Giving Vincent 主動關心型

「我想聽聽你最近遇到的好事」
我們參考了史丹佛大學人機互動實驗室的聊天機器人-Woebot的互動模式。
在這組的受測者會收到Vincent的關懷訊息,主動詢問受測者當天的心情指數,最近有遇到什麼開心或是難過的事。

Care-Receiving Chatbot 需要關心型

「你可以說一些鼓勵我的話嗎」
這組的受測者會聆聽Vincent分享最近遭遇的壞事,這些情境參考自另一組實驗(Falconer, et al, 2015),實驗中他們測試受訪者在聽到一些故事的當下怎麼反應、怎麼試圖安慰說故事的一方。我們則把這些故事都設計成和聊天機器人相關的狀況。

故事舉例:

出門忘記帶鑰匙 ->忘記數據庫的登入密碼
上班會議遲到 ->參加聊天機器人會議遲到

問卷設計

在實驗前與實驗後的問卷使用Kristin Neff (2003) 的問卷設計,可以用來量化受測者的self-compassion指數。

🔎實驗結果

兩周實驗後,我們搜集了問卷的量化數據與受測者和Vincent聊天時的質化數據。透過分析這些資料,去證明我們的假設是否正確,也挖掘出一些特別的互動模式。

清理數據

在分析數據前,要先清理掉一些會干擾結果的數值。我們定義了使用者的投入性(Engagement Level)當做標準,比較使用者平均與Vincent互動的時長,找到3個受測者低於平均標準,這意味著他們用非常短的時間閱讀並回應Vincent。再查閱了他們回復Vincent的內容,所用字數也比總體平均少。

透過這些調查,推估這些人可能只快速滑過每一則訊息,並沒有好好和Vincent互動,這樣的作答結果也就缺少分析的意義。

量化分析

我們前面假設了兩種聊天機器人都能提升人的心理健康,實驗結果也證明了受測者在經過兩週的互動後,心理健康的指數皆有成長;

不過,

主動給與關心(Care-Giving)的Vincent並沒有讓受測者得到顯著的成長,

唯有需要被關心(Care-Receiving)的Vincent讓受測者的心理健康得到顯著成長。

值化分析

我們將所有受測者對兩種Vincent說過的話做三種主題分類。Mindfulness,Self-Kindness, Common Humanity,這三種行為特征構成了Self-Compassion。雖然這些使用者行為都有出現在與兩種Vincent的互動中,不過更多出現在需要關心(Care- Receiving)的組別。

“我會試著爬窗戶進去,不過如果是你的話,我想你可以試試看駭入那個資料夾!”

在CR的組裡面,我們也看到一些有趣的回應,受測者把自己放在聊天機器人的立場,試著給Vincent出些主意。

在CR的互動模式,人們更願意與Vincent建立強的聯結。

🔎結果總結

在兩種與Vincent的互動模式中,CR Vincent (機器人需要被關心)組,人們會傾向給予實際的意見,也會設身處地為對方(Vincent)著想;在CG Vincent (機器人給予關心)組,人們傾向敞開心房地談生活私事(在願意與Vincent分享的前提下)。

總體來說,CG Vincent引導出正面的生活心情分享;CR Vincent則是引導出鼓勵的、振奮人心的話語。

設計應用

Vincent有著非常局限的回答能力,基本上都照著事先編輯好的故事走;不過仍然能給使用者帶來顯著的正面影響。我們期待透過這份前沿研究,開創新的聊天機器人的互動設計方向,植入更多更多的可能性,讓人們有健康的心理去面對每一天的挑戰。

References

Falconer, C. J., King, J. A., & Brewin, C. R. (2015). Demonstrating mood repair with a situation-based measure of self-compassion and self-criticism. Psychology and Psychotherapy: Theory, Research and Practice, 88(4), 351–365. http://doi.org/10.1111/papt.12056

Neff, K. D. (2003). The development and validation of a scale to measure self-compassion. Self and identity, 2(3), 223–250. https://doi.org/10.1080/15298860309027

--

--