Lab of Ontologies, Language Processing & e-Humanities

Welcome to LOPE Lab at the Institute of Linguistics, National Taiwan University

Author: lopegilntu

01/21 | 曾昱翔博士受邀演講「深度學習的超級分類器:Bert 實作工作坊」

|講題:深度學習的超級分類器:Bert 實作工作坊 |講者:曾昱翔 博士 |時間:2020年01月21日(四)10:20 – 12:10 |地點:國立臺灣大學國家發展研究所 302 教室 |主辦單位:Python程式寫作與文本分析導論課程(授課教師:鄧志松) |相關連結:國發所網頁公告

Read More

[活動] 歡迎參加 NLP 業界學長姊座談會!

時間:2020 年 11 月 24 日 (二) 17:30 ~ 19:00 地點:台大語言所 樂學館 305 教室 報名: 座談會報名表單

Read More

[活動] 歡迎參加「第二屆語料庫程式實務工作坊」!

在 2018 第一屆語料庫程式實務工作坊的基礎上,今年 12 月我們將舉辦第二屆語料庫程式實務工作坊,帶領大家從已有的實際語料出發,介紹中文自動化標記、創建語料庫索引、利用現有資源建立自有語料庫、分享語料庫研究相關專案與應用。歡迎點閱 Hocor 2020工作坊網頁 了解更多詳情、共襄盛舉! 活動日期:2020 年 12 月 12、13日 活動會場:國立臺灣大學普通教學館 102 教室 報名資格:參加者須具備 Python 程式能力 報名費用:免費參加(由台大文學院人文創化計畫補助) 人數限制:80 人 報名期間:即日起至 2020 年 12 月 4 日(額滿截止) 報名方式:請填寫 Hocor 2020 報名表單

Read More

【賀】林宜儒獲得 2020 台灣語言學學會最佳碩士論文獎!!!

恭喜本實驗室畢業生林宜儒獲得 2020 台灣語言學學會最佳碩士論文獎,並即將在 11/14 的 NCL 頒獎後發表演講!

Read More

[活動] satRday Taiwan (廖永賦同學)

時間:2020/10/17 地點:淡江大學驚聲大樓(新北市淡水區英專路 151 號) 講題:GETable : 透過 JavaScript 即時生成 R Markdown 表格 活動網址:https://taiwan2020.satrdays.org/

Read More

[活動] AI tutorial at ROCLING 2020 (謝舒凱、曾昱翔)

謝舒凱老師與曾昱翔老師將在 9/26 上午的計算語言學年會進行「中文語意計算入門」的教學演講,歡迎參加! https://sites.google.com/ntut.org.tw/rocling2020/ai-tutorial?authuser=0

Read More

[賀] Paper accepted at PACLIC 2020

“Dear Authors, On behalf of the PACLIC 34 Program Committee, I am delighted to inform you that the following submission has been accepted  to appear at the conference: ————————————————Paper Number 78:Shu-Kai Hsieh, Yu-Hsiang Tseng, Chiung-Yu Chiang, Richard Lian, Yong-fu Liao, Mao-Chang Ku, Ching-Fang Shih “From Sense to Action:  A Word-Action Disambiguation Task in NLP”————————————————————————- “

Read More

[賀] 本實驗室錄取 ROCLING 2020 口頭論文三篇

We are pleased to inform you that your paper submitted to ROCLING 2020 has been accepted as an <Oral> paper. The paper will be published in the ROCLING 2020 conference proceedings and included in the ACL Anthology. Please read the comments carefully and revise your paper accordingly. Mitigating Impacts of Word Segmentation Errors on Collocation […]

Read More

[賀] 陳盈瑜同學通過碩士論文口試

恭喜盈瑜 (Yola) 以優異成績通過碩士論文口試。論文題目為「文本意圖的多模態分析:以 Instagram 為例 (An Analysis of Multimodal Document Intent in Instagram Posts)」。 摘要如下: 時至今日,社群媒體(如 Instagram)趨向結合圖片以及文字表徵,建構出一種 新的「多模態」溝通方式。利用計算方法分析多模態關係已成為一個熱門的主題,然而,尚未有研究針對台灣的百大網紅發文中的多模態圖文配對(Image-caption Pair)來分析文本意圖和圖文關係。利用文字和圖片的多模態表徵,本研究沿用 Kruk et al. (2019) 的圖文關係分類方法(contextual relationship/semiotic relationship/authors intent), 對此三種分類提出新的圖文表徵方式(Sentence- BERT 及 image embedding), 並利用計算模型(Random Forest, Decision Tree Classifier)精準分類三種圖文關係,研究結果顯示正確率高達 86.23%。 Present-day, a majority of representation style on social media (i.e., Instagram) tends to combine visual and textual […]

Read More

[賀] 林宜儒同學通過碩士論文口試

恭喜宜儒 (Jessica) 以優異成績通過碩論。論文題目為「以計算與認知觀點預測分析梗圖裡的黑色幽默」(Predicting Dark Humor in Internet Memes: A Computational and Cognitive Approach) 摘要 本論文主要核心內容為運用神經網路模型 (neural network) 來預測網路迷因 (internet memes) 的黑色幽默程度,並藉用認知語言學的觀點來解釋模型結果。 根據本研究的定義,地獄哏 (hellish gags) 梗圖常用來傳達“黑色幽默”的效果, 指的是以他人或是自身的殘障、悲劇或其他足以引人悲傷、憤怒的事情做為幽默、笑點的梗圖。不過,卻也時常因文本呈現的手法太過獨特,使閱聽者「忍不住覺 得好笑」,游移於「道德」與「不道德」間的模糊地帶。本研究將黑色幽默視為一 個連續體 (continuum) 現象,最極致的一端為已失去幽默效果的仇恨言論,是純 粹以攻擊個人或團體為目的的言論,例如:性別、人種、宗教、族群、殘疾或性 取向等。透過這樣的標準,我們運用神經網路模型來預測一個梗圖裡的黑色幽默 程度,若我們的模型顯示黑色幽默程度過高,極有可能暗示它是已失去幽默效果 的冒犯性梗圖 (offensive meme)。 研究結果顯示,透過運用梗圖裡的字幕、圖片、及模板名稱,我們的模型可以 達到 64% 的預測效果。並且,多模態 (multimodal) 預測模型也顯示字幕及模板 名稱對於預測黑色幽默有最好的效果。此外,由於幽默涉及人類認知經驗,因此 本研究借用認知語言學研究提出理解梗圖所需的四種能力,比較人類與機器在理 解梗圖歷程上的差異。若能將人類理解梗圖幽默所運用的知識轉化為機器學習的 特徵,相信會對機器在理解幽默上有所幫助。總結而言,本研究主要貢獻有二: 一是透過計算模型來自動篩選出冒犯性梗圖;二是結合認知上的觀點來解釋、分 析神經網路模型的結果,希望藉此增進對於黑色幽默梗圖的認識。 關鍵詞: 黑色幽默、地獄哏、多模態幽默、神經網路模型、認知語言學

Read More

LOPE Lab @ The Graduate Institute of Linguistics, National Taiwan University