在 LINE台灣第七屆開發者大會「LINE TAIWAN TECHPULSE 2023」活動上,以「開發與創新」為主軸,著重於「流程再造、創新應用」等各式技術議題。LINE台灣技術長陳鴻嘉在開場活動當中,率先公開了自研SmartText自然語言處理平台2.0 ,初期可以用來執行文件分類(Classifier)、多標籤分類(Multi-label Classifier)、主題偵測(Topic Detection)等自動化任務。
LINE台灣技術長陳鴻嘉分享去年(2022)5大台灣在地開發專案成果,以「開發治理」、「資料治理」及「文化養成」3面向優化管理系統,另外標準化前端開發流程,同時導入開發和維運(DevOps)思維、運用 DORA 四大指標及優化內部可觀察性的技術架構,讓團隊在研發上更敏捷。此外,隨著生成式AI逐步落地,LINE首度對外發表自行研發的SmartText自然語言處理平台2.0。

LINE提供用戶各種貼近生活的服務,而多元內容大都以文字呈現,顯示「自動化的文字處理」至關重要,因此LINE工程團隊以三大要素:資料(Data)、自然語言處理模型(NLP Models)、服務整合(Service Integration)建構了自然語言處理(NLP)賦能的應用。每個服務皆有各自的自然語言處理任務需求(NLP Tasks),而有些任務的需求共通,為了更有效率地使用NLP Models,且可通用於LINE旗下不同的服務領域,工程團隊提出「自然語言處理即服務」(NLPaaS)的概念,將自然語言處理(NLP)賦能應用的建構流程標準化,快速建構出不同的NLP Models,加速自然語言的處理,因此研發出「SmartText自然語言處理平台」。
初版的SmartText自然語言處理平台即可透過模型進行常見的文字自動化任務,如文件分類(Classifier)、多標籤分類(Multi-label Classifier)、主題偵測(Topic Detection)等。
此次首次公開的「SmartText自然語言處理平台2.0」計畫可執行更多元的NLP任務,包含文章摘要(Article Summarization),自動摘要可以把長篇的語義,經過AI系統處理之後,讓系統以一個API的形式,形成摘要。讓用戶透過文章摘要可以更快速找到想要的內容,應用領域除了新聞領域之外,也可以應用在電商領域。另外像是換句話說(Paraphrasing),則是讓用戶輸入一段話、換成另外一段話形式,透過換成不同說法,來應對不同使用者需求。其他還有問答(Question-Answering)、客製化廣告文案生成(Text Generation)等,持續協助處理各式各樣文字自動化的複雜需求。
隨著文字應用場景更加廣泛普及,SmartText 2.0將朝向快速生成式內容的方向努力,期許未來成為導入AI應用的得力助手,透過自然語言處理,結合語音、圖像、影片等多元化應用,讓AI走入大眾生活,成為提升生活品質的最好夥伴。