程式設計實習(二) Computer Programming Lab.(II)

自然語言處理專題

透過實作中文斷詞演算法,瞭解如何處理自然語言處理中基本的中文斷詞,並且透過利用單元測試工具確保程式碼的品質。

學習目標

本課程從自然語言處理的背景簡介和相關應用介紹出發,透過對於自然語言處理的基本任務—中文斷詞處理,讓學生在自然語言處理上有實際的實作經驗。

主要目標有:

    1. 瞭解自然語言處理的相關應用與概念

    2. 藉由長詞優先演算法實作一個以字典為基礎的中文斷詞系統

    3. 藉由開放原始碼的單元測試套件確保實作程式碼的品質

系統描述

課程分為如下:

    • 自然語言處理的背景介紹

    • 長詞優先演算法與字典檔

    • 測試驅動的開發方式

96-第一週投影片 - 自然語言處理之簡介與相關應用,包含專題計畫介紹與 CppUnit。

96-第三週投影片 - 長詞優先演算法與作業回顧;討論長詞優先演算法的問題

96-第二週投影片 - 回顧之前介紹的自然語言處理、中文斷詞,與程式介面說明

96-課程講義 - 課程講義;包含 CppUnit 的安裝與使用說明。

97-第一週投影片 - 自然語言處理之簡介與相關應用;專題計畫介紹

97-第三週投影片 - 中文斷詞簡介與程式介面說明。

97-第二週投影片 - Googletest 簡介。

97-第四週投影片 - 作業與長詞優先演算法回顧,分析長詞優先演算法的問題。

99-第一週投影片 - 自然語言處理之簡介與相關應用

99-第三週投影片 - 中文斷詞簡介,與[簡化版]長詞優先演算法

99-第二週投影片 - Googletest 簡介

99-第四週投影片 - 完整長詞優先演算法與可能遭遇的問題

數位學習寵物 - 與可觸摸的互動式數位學習機器寵物對話。