隨著 NLP 技術的成熟(自然語言處理,Natural Language Processing,是研究人與計算機交互的語言問題的一門學科),不少人文社科領域的專家也呼吁結合相關技術進行研究和學習。近日,斯坦福大學發布了一門明年 1 月的公開課程,主要關注 AI 中的自然語言處理和社交網絡的結合應用,適合文科生學習。近日,斯坦福大學的另一門 NLP 公開課程也放出了課程通知,即將于 2020 年 1 月開始授課。
這門課程最大的亮點在于:主講 NLP 和人文社會學科的結合。課程對技術的介紹主要針對的是相關的應用,而非為了技術而講技術。同時,課程要求也不高,很適合懂一點編程的文科學生學習。

據課程頁面介紹,這門課程偏向于學科交叉。它結合了自然語言處理、信息抽取和社交網絡,是一項在介紹 NLP 知識的同時融合社交網絡應用的課程。
具體而言,課程會像很多 NLP 基礎課程那樣,介紹自然語言處理的相關知識。在算法方面包括:樸素貝葉斯、邏輯回歸、詞嵌入、詞向量等內容。在應用方面則包括了情感分析、信息抽取、推薦系統和對話機器人,主要用于社交網絡。此外,對于不了解 Python 的人來說,課程提供了一個可選的 Python 指導。
從內容來看,課程偏向入門,甚至沒有看到神經網絡之類的復雜模型。盡管課程要求中提到學生如果學習了斯坦福大學的 CS107、CS103 或 CS109 課程會很有幫助,但是這些也不是強制的。不過,如果學生參加過了 106B 的課程,具有一些編程經驗會更好。
在教科書方面,課程使用的都是電子版的教科書,分別是以下兩本:
書籍 1:Speech and Language Processing(3rd ed. draft)。這本書是電子版的,可以從網站直接打開。
書籍 2:Introduction to Information Retrieval.(信息檢索概論),作者是著名的 Christopher Manning 等。
斯坦福大學有一個免費閱讀和下載地址:https://nlp.stanford.edu/IR-book/pdf/irbookonline reading.pdf,課程共有十周,每周兩次課,目前已經放出了完整的目錄。
這門課程的主講人是 Dan Jurafsky,是斯坦福大學的一位教授。主要研究方向是自然語言處理和社會科學的應用。
這位老師曾擔任了 CS384 等課程的教師,也在 2012 年幫助過 Manning 在 MOOC 上的公開課。從專業背景來看,讓這位老師教授這門課也就不足為奇了。對于人文社科和 AI 的結合,近年來已經可以看到類似的趨勢,如李飛飛等利用計算機視覺統計社區車輛類型,進而預測該社區在大選中的投票趨勢。斯坦福大學本次公開這樣一門課程,無疑會鼓勵更多非計算機領域的學生,利用 AI 技術推進工作和研究。