程式設計實習(二) Computer Programming Lab.(II)
自然語言處理專題
自然語言處理專題
透過實作中文斷詞演算法,瞭解如何處理自然語言處理中基本的中文斷詞,並且透過利用單元測試工具確保程式碼的品質。
學習目標
本課程從自然語言處理的背景簡介和相關應用介紹出發,透過對於自然語言處理的基本任務—中文斷詞處理,讓學生在自然語言處理上有實際的實作經驗。
主要目標有:
瞭解自然語言處理的相關應用與概念
藉由長詞優先演算法實作一個以字典為基礎的中文斷詞系統
藉由開放原始碼的單元測試套件確保實作程式碼的品質
系統描述
課程分為如下:
自然語言處理的背景介紹
長詞優先演算法與字典檔
測試驅動的開發方式
96-第一週投影片 - 自然語言處理之簡介與相關應用,包含專題計畫介紹與 CppUnit。
96-第三週投影片 - 長詞優先演算法與作業回顧;討論長詞優先演算法的問題
96-第二週投影片 - 回顧之前介紹的自然語言處理、中文斷詞,與程式介面說明
96-課程講義 - 課程講義;包含 CppUnit 的安裝與使用說明。
97-第一週投影片 - 自然語言處理之簡介與相關應用;專題計畫介紹
97-第三週投影片 - 中文斷詞簡介與程式介面說明。
97-第二週投影片 - Googletest 簡介。
97-第四週投影片 - 作業與長詞優先演算法回顧,分析長詞優先演算法的問題。
99-第一週投影片 - 自然語言處理之簡介與相關應用
99-第三週投影片 - 中文斷詞簡介,與[簡化版]長詞優先演算法
99-第二週投影片 - Googletest 簡介
99-第四週投影片 - 完整長詞優先演算法與可能遭遇的問題
數位學習寵物 - 與可觸摸的互動式數位學習機器寵物對話。