看看網頁版全文 ⇨ 雜談:ComfyUI很好用,但結果跟WebUI不一樣 / ComfyUI Is User-Friendly, But Results Differ From WebUI https://blog.pulipuli.info/2025/01/comfyui-is-userfriendly-but-results-differ-from-webui.html 繼上次把Forge裝起來後,我還是覺得生圖的方式太沒效率了,所以轉向尋求其他工具。 這次嘗試的是Dify跟ComfyUI的結合。 ---- # 基礎圖片 / Baseline 我們先來試試看用同樣的配置在不同環境下的表現。 由於Forge可以設定的比較詳細,我們先以Forge的設定為基礎。 這張希希助教的完整設定如下: 模型使用的是Stable Diffusion 1.5系列。 SDXL跟Pony一直找不到類似的感覺,真令人困擾,到最後還是用回了SD 1.5。 以下是模型的相關資料: - Base Model: 7th_anime_v3_Chttps://huggingface.co/syaimu/7th_Layer/blob/main/7th_anime_v3/7th_anime_v3_C.ckpt - LORA: Gacha splash LORA - v4.0https://civitai.com/models/13090/gacha-splash-lora - LORA: Genshin Sticker Chibi Style - GenshinStickersV1https://civitai.com/models/20163/genshin-sticker-chibi-style - LORA: koreanDollLikeness_v15https://civitai.com/models/24372/koreandolllikenessv15 - embedding: bad-hands-5https://civitai.com/models/116230/bad-hands-5 - embedding: bad_prompt Negative Embeddinghttps://civitai.com/models/55700/badprompt-negative-embedding - embedding: EasyNegativehttps://civitai.com/models/7808/easynegative - VAE: kl-f8-anime2 VAEhttps://civitai.com/models/23906/kl-f8-anime2-vae 如果要圖片變得更細緻,需要搭配ControlNet的tile使用:。 ---- 繼續閱讀 ⇨ 雜談:ComfyUI很好用,但結果跟WebUI不一樣 / ComfyUI Is User-Friendly, But Results Differ From WebUI https://blog.pulipuli.info/2025/01/comfyui-is-userfriendly-but-results-differ-from-webui.html
看看網頁版全文 ⇨ 用Felo AI對「布丁布丁吃什麼?」提問吧! / Ask "What does Pulipuli eat?" with Felo AI! https://blog.pulipuli.info/2025/03/ask-what-does-pulipuli-eat-with-felo-ai.html 自從「布丁布丁吃什麼?」改用Felo AI作為站內的搜尋引擎之後已經一段時間了。 這對部落格的使用帶來什麼影響呢?讓我們一起來看看吧。 Since "Pulipuli's Blog" switched to using Felo AI as its internal search engine, some time has passed. What impact has this had on the blog's usage? Let's take a look.。 ---- # 「問」部落格 / "Ask" Blog。 「布丁布丁什麼?」部落格的Felo AI引擎安裝在右上角的搜尋框內,用對話的圖示 來顯示。 手機版也可以點選右上角的「選單」圖示,就可以看到在下拉選單裡面的搜尋按鈕。 按下去之後會開啟Felo AI搜尋引擎的網頁,並且需要等待一段時間,讓Felo AI拆解問題、轉換問題的形式、搜尋,最後彙整結果。 稍待片刻,我們可以看到Felo AI彙整的回答。 值得注意的是,由於我在問題裡面加上了「site:blog.pulipuli.info」的範圍限制,這會讓Felo AI搜尋的來源限縮與「布丁布丁吃什麼?」。 你可以注意到Felo AI的回覆會有引用來源。 而這些來源會指向網站內的連結。 如果想要確認Felo AI回覆的細節,可以點開來源網站,查閱詳細的資訊。 ---- # 成也IR,敗也IR / IR: A Double-Edged Sword。 在大多時候Felo AI作為站內搜尋引擎的表現都比我想像中的好上許多。 儘管它背後運作原理是大型語言模型,也就是像是聊天機器人一樣的形式,但我們依然可以用關鍵字來搜尋。 只要關鍵字本身可以透過Google搜尋引擎在部落格找到結果,那Felo AI也就能夠取得類似的資料,並將它作為資料來源,提供給大型語言模型撰寫回答。 在「Linux 發佈版 site:blog.pulipuli.info」的例子中,我們可以看到Felo AI找到了20個資料來源,以此擬定答案。 但「布丁布丁吃什麼?」提到Linux發佈版的文章只有20篇嗎?我可不這樣覺得。 如果改用Google搜尋引擎的話,我們可以找到更多與Linux有關的相關文章。 沒錯,Chromebook也是能夠用Linux多個發佈版,並運作Linux APP的喔!。 ---- 繼續閱讀 ⇨ 用Felo AI對「布丁布丁吃什麼?」提問吧! / Ask "What does Pulipuli eat?" with Felo AI! https://blog.pulipuli.info/2025/03/ask-what-does-pulipuli-eat-with-felo-ai.html
看看網頁版全文 ⇨ 雜談:期盼了三年的巧味豬腳便當 / Long-Awaited Chiao Wei Pork Bento https://blog.pulipuli.info/2025/03/longawaited-chiao-wei-pork-bento.html 天下第一攤的手作便當,依然十分美味。 ---- # 木新市場的在地美食 / Local food in Muxin Market。 我在政大唸書跟工作時住在木新市場附近,附近美味的食物大概了解十之八九。 後來去淡水工作,就很難有機會再回來這附近吃飯。 以前是有幾次要從七張站趕去政大,但很難趕上早上營業的木新市場。 最近總算有機會,一早就在政大把事情處理完,然後搭車來到木新市場這邊吃飯。 在公車站「木新市場」下車後,看到那個7-11,轉過頭就會是熱鬧的木新市場。 總覺得木新市場周圍環境有比之前更乾淨了些,應該是有在持續整頓吧。 木新市場的本身有二層,市場的部分集中在一樓。 裡面面積很大,地下是停車場。 來到靠近角落的攤販,那個熟悉的「天下第一攤 手作便當」招牌依然懸掛在哪裡。 而對面仍然是勤快地幫豬腳剃毛的阿姨們。 不同的是,不知道是不是我太早到的關係,並沒有看到以往的排隊人潮,而且內用的桌椅也撤收了。 跟老闆打了招呼,敘敘舊。 老闆說是因為曾經有客人在內用時起了爭執,所以才取消內用的餐位。 我懂,這便當真的是好吃到會讓人搶佔位置。 我買了95元的招牌便當,到附近找個地方享用它。 # 招牌便當 / Signature Bento。 招牌便當裡面有控肉、腱子、蹄膀,配菜有滷白菜、油豆腐和筍絲。 我通常都吃腱子肉,帶筋咬起來很紮實,可以感受到大口吃肉的快感。 豬腳的蹄髈嚼起來十分帶勁。 咀嚼的時候口裡會被滷肉的香氣佔滿。 焢肉則是肥瘦兼具,但口感軟嫩,彷彿可以用吞一樣,一不小心肉就消失了。 我也好喜歡他們家的筍絲,滷得十分入味,又不會死鹹。 最後又回去買了一些真空包裝的豬腳、蹄膀、三層肉,之後可以帶回去幫家裡加菜。 事隔快三年,能再次吃到巧味豬腳便當真的是太感動了。 不過吃完胖胖便當,接下來得要好好運動才行喔!。 ---- 看看網頁版全文 ⇨ 雜談:期盼了三年的巧味豬腳便當 / Long-Awaited Chiao Wei Pork Bento https://blog.pulipuli.info/2025/03/longawaited-chiao-wei-pork-bento.html
看看網頁版全文 ⇨ Python自然語言處理應用:命名實體識別與情緒分析 / Python Natural Language Processing Applications: Named Entity Recognition and Sentiment Analysis https://blog.pulipuli.info/2025/03/python-natural-language-processing-applications-named-entity-recognition-and-sentiment-analysis.html 儘管大型語言模型的盛行讓大家瞭解到AI分析文字的能力,但直接以命名實體識別和情緒分析來處理文本的做法,在具有特定目標的研究報告裡仍扮演著重要的角色。 這篇就讓從我們從學習Python的使用,一步一步踏入命名實體識別和情緒分析的領域吧。 Although the prevalence of large language models has made people aware of AI's ability to analyze text, direct processing of text using Named Entity Recognition (NER) and Sentiment Analysis (SA) still plays a vital role in research reports with specific objectives. This article will guide us through the process of learning Python, step by step, to delve into the realm of Named Entity Recognition and sentiment analysis.。 Short URL: https://l.pulipuli.info/24/nsysu。 ---- # 簡介 / Introduction 在大數據時代,如何從巨量的非結構性文字資料中萃取出有價值的資訊,以支持決策和洞見,已成為一項現代人應具備的重要技能。 本次演講將介紹如何應用當前主流的深度學習模型,聚焦於自然語言處理(NLP)的兩個核心議題:命名實體識別(Named Entity Recognition, NER)與情緒分析(Sentiment Analysis)。 我們將以實作教學的方式,帶領大家深入了解這些技術的應用場景與實際操作。 演講中,我們將使用 Python 作為主要程式語言,並在 Google Colab 上進行操作,讓您能夠動手實作,親身體驗 NLP 的魅力。 請與會者提前準備好電腦,並註冊與登入 Google Colab,與我們一起探索自然語言處理的世界,共同激發更多創新的應用想法!。 ---- # Part 1. 環境配置篇 / Environment Configuration。 ---- 繼續閱讀 ⇨ Python自然語言處理應用:命名實體識別與情緒分析 / Python Natural Language Processing Applications: Named Entity Recognition and Sentiment Analysis https://blog.pulipuli.info/2025/03/python-natural-language-processing-applications-named-entity-recognition-and-sentiment-analysis.html
看看網頁版全文 ⇨ 雜談:到底要怎麼使用RAGFlow呢? / TALK: RAGFlow Drained All My Resources https://blog.pulipuli.info/2025/03/talk-ragflow-drained-all-my-resources.html 由於這次RAGFlow看起來又無法順利完成任務了,我還是來記錄一下目前的狀況吧。 ---- # 專注做好RAG的RAGFlow / RAGFlow: Focusing on RAG。 https://ragflow.io/ 在眾多LLM DevOps的方案中,RAGFlow也絕對可以算得上是重量級的那邊。 相較於其他方案,RAGFlow一直積極加入各種能夠改進RAG的特殊技術,使得它在RAG的應用方面出類拔萃。 RAGFlow的主要特色包括了: 1. 文件複雜排版分析功能:能夠解讀表格,甚至能分析PDF裡面圖片的文字。 2. 分層摘要RAPTOR。能改善RAG用分段(chunking)切斷資訊的問題。 3. 結合知識圖譜的GraphRAG跟LightRAG。讓回答著重與命名實體,而且還可能找到詞彙之間的隱含關係。 4. 能作為Dify外部知識庫使用。 不過,除了第四點之外,要做到前三項功能,目前看起來還有很多問題需要克服。 # 硬體要求 / Hardware Requirements。 由於運作RAGFlow會使用OCR來分析文件的排版,記憶體最好是給到16GB之多,硬碟空間也需要準備50GB。 這真的是重量級的方案。 如果這些準備好的話,要做到分析複雜排版文件的這件事情就不是很難了。 只要做到這個程度,RAGFlow就能在回答引用時顯示來源的文件位置。 這樣幫助就很大了呢。 # 大量請求的難題 / The Challenge of Numerous Requests。 相較於排版分析是RAGFlow組件中的功能,RAPTOR跟Knowledge Graph都要搭配大型語言模型才能解析跟查詢資料。 而RAGFlow在處理資料的時候會在短時間內發送大量的API請求,很容易就被rate limit限流。 既然直接連接LLM API會因為太多請求而被限流,我就試著改轉接到Dify上,並在API請求的時候加上排隊等候的機制。 Dify裡面雖然可以寫程式碼,但他其實也是在沙盒裡面運作的程式,還是有著不少的限制。 其中一個限制就是不能讓我直接修改系統上的檔案。 因此如果要在Dify內用程式讀寫資料,用HTTP請求傳送可能是比較好的做法。 這些做法花了很多時間調整。 調整了老半天,總算能夠讓它正常運作。 不過過了一陣子,LLM API連回應沒有反應了。 我猜想可能是連接的Gemini API已經超過用量而被禁止吧。 ---- 繼續閱讀 ⇨ 雜談:到底要怎麼使用RAGFlow呢? / TALK: RAGFlow Drained All My Resources https://blog.pulipuli.info/2025/03/talk-ragflow-drained-all-my-resources.html
看看網頁版全文 ⇨ 讓Dify使用自己管理的搜尋引擎:SearXNG / Let Dify Use My Self-Hosting Search Engine: SearXNG https://blog.pulipuli.info/2024/12/let-dify-use-my-selfhosting-search-engine-searxng.html 我在「自行架設大型語言模式應用程式:Dify」這篇講到我用SerpAPI作為Dify的搜尋引擎,但除了使用別人提供的API之外,我們也可以用SearXNG自行架設客製化的搜尋引擎,並將它跟Dify結合一起使用。 In the article "Self-Hosting a Large Language Model Application: Dify," I mentioned using SerpAPI as the search engine for Dify. However, besides using third-party APIs, we can also utilize SearXNG to set up a customized search engine and integrate it with Dify.。 ---- # SearXNG:可自訂的後設搜尋引擎 / SearXNG: A Customizable Metasearch Engine。 https://docs.searxng.org/。 SearXNG 是一個免費且開源的後設搜尋引擎(metasearch engine),它可以彙整來自超過上百種不同的搜尋服務(例如Google、Bing、DuckDuckGo等)的結果,讓使用者一次搜尋就能得到更全面的資訊。 SearXNG 實際上是從另一個開源專案 Searx 延伸出來的分支,並在其基礎上進行了改進和更新。 SearXNG 提供了一個簡潔易用的介面,讓使用者可以輕鬆地輸入關鍵字並快速得到搜尋結果。 除了基本的網頁搜尋之外,SearXNG 也支援圖片、影片、新聞、地圖等不同類別的搜尋,滿足使用者多元的搜尋需求。 使用者還可以透過設定偏好設定(preferences)來自訂搜尋引擎的行為,例如選擇想要使用的搜尋服務、設定搜尋結果的語言和地區等等,打造個人化的搜尋體驗。 https://searx.space/ 有別於其他的搜尋引擎服務,SearXNG 大多是使用者自行建置在私人伺服器的個體(instance)。 我們可以在 searx.space 找到許多公開的 SearXNG 執行個體,但更多時候,我們會需要用它架設一個私人使用的 SearXNG 執行個體,不僅讓自己完全掌控自己的搜尋資料,更可以作為Dify等其他系統的資料來源。 ---- 繼續閱讀 ⇨ 讓Dify使用自己管理的搜尋引擎:SearXNG / Let Dify Use My Self-Hosting Search Engine: SearXNG https://blog.pulipuli.info/2024/12/let-dify-use-my-selfhosting-search-engine-searxng.html
看看網頁版全文 ⇨ 雜談:時常脫落的電燈泡 / TALK: Lightbulbs That Frequently Fall Out https://blog.pulipuli.info/2025/03/talklightbulbs-that-frequently-fall-out.html 今天把電燈鎖緊,它亮了起來。 但過一段時間,它又鬆脫了。 ---- # 燈泡 / Light bulb 搬到新住處之後,讓我最苦惱的問題,是這裡的電燈泡時常自己脫落。 是的,自己脫落。 這裡不太常感覺到地震,我也確實有把電燈泡鎖緊到燈座上,但燈泡還是會在過一段時間後自然脫落。 大多時候碰一下就會暫時恢復。 有時候可能是燈泡鬆脫,需要轉回燈座上。 有時候就算在燈座上轉緊,燈泡也不會亮。 但過段時間再開燈時,他又正常點亮了。 ---- # 找不到線索 / No Clue Found。 在網路上找尋的過程裡,大多數說法是因為地震所導致的結果。 不過這些燈泡鬆脫的時間點好像跟地震沒有明顯的關聯,感覺可能性不高。 之前有工程的朋友說,這可能是熱脹冷縮導致燈泡脫離了燈座。 網路上這種使用說法的相關資料不多。 ChatGPT認為的確有可能,但他認為比較大的原因還是因為燈泡、燈座或線路等硬體不良所導致。 換燈座跟線路並不是馬上可以做到的事情,我下次可能先試試看換個燈泡好了。 ---- 沒想到燈泡還會有自然鬆脫的這種狀況,不知道大家有沒有遇過?你們會怎麽處理呢?求求網路大神賞我一些建議吧。 ---- 看看網頁版全文 ⇨ 雜談:時常脫落的電燈泡 / TALK: Lightbulbs That Frequently Fall Out https://blog.pulipuli.info/2025/03/talklightbulbs-that-frequently-fall-out.html
看看網頁版全文 ⇨ AI繪圖教學投影片:AI繪圖教學 x 教AI學習繪圖 / AI Image Generation in Education: From Learning to Draw to Teaching AI to Draw https://blog.pulipuli.info/2025/03/aiimagegenerationineducationfromlearningtodrawtoteachingaitodraw.html 為了讓大家瞭解如何使用提示詞來進行AI繪圖,本次教學以Kera AI為繪圖平台,一步一步帶領大家從簡單的提示詞、提示詞的變化,到使用圖片來引導繪製圖片。 最後則是介紹更進階的控制圖片技巧,希望成為大家踏入AI繪圖領域的敲門磚。 To help everyone understand how to use prompts for AI art generation, this tutorial uses Kera AI as the drawing platform and will guide you step-by-step from simple prompts, variations of prompts, to using images as references. Finally, we will introduce more advanced image control techniques, hoping to serve as a stepping stone for everyone entering the field of AI art.。 Short URL: https://l.pulipuli.info/24/hsc。 ---- # 課程簡介 / Abstract 近年來,人工智慧(AI)技術快速發展,AI 繪圖工具也日漸普及,不僅改變了藝術創作的方式,也為教材的製作帶來新的可能性。 本演講將介紹生成式繪圖技術的概念,並探討如何利用 AI 繪圖滿足教學需求。 本演講將深入了解目前的 AI 繪圖技術,及這些技術選擇上的考量。 再來探討教學中教材製作的繪圖需求,包括版權議題、適用性等諸多考量,並介紹用開放素材庫輔助AI繪圖的使用方式。 演講最後則是進一步討論控制AI繪圖以符合統一樣式的進階做法。 希望本演講能幫助教師精進教材呈現,進而讓學生能從教師講課和教材的視覺刺激來加深學習印象。 演講內含上網操作電腦的實作,也會用到Google帳號的登入。 本演講主要是適合教育工作者以及對 AI 繪圖應用於教學有興趣的人士參與。 ---- # Part 1. 生成式AI繪圖 / Generative AI Art。 ---- 繼續閱讀 ⇨ AI繪圖教學投影片:AI繪圖教學 x 教AI學習繪圖 / AI Image Generation in Education: From Learning to Draw to Teaching AI to Draw https://blog.pulipuli.info/2025/03/aiimagegenerationineducationfromlearningtodrawtoteachingaitodraw.html
看看網頁版全文 ⇨ 雜談:弱電箱換上了MikroTik路由器 / TALK: I Placed a MikroTik Router in the Low-Voltage Wiring Box https://blog.pulipuli.info/2025/01/talki-placed-a-mikrotik-router-in-the-lowvoltage-wiring-box.html 由於放在弱電箱裡面的無線基地臺一直當機,這次索性購買了MikroTik路由器RB450Gx4來用用看。 這款號稱最適合放在弱電箱裡面的路由器,究竟會是如何呢?。 ---- # 從弱電箱出來的網路 / Network Connection Point in the Low-Voltage Wiring Box。 我到最近居住的地方才開始認識弱電箱這種環境。 以前的居住場所,網路總是直接一條線拉到室內,接著接上基地臺、路由器,就能讓屋內其他設備連上網路。 不過現在的住宅大部分都有弱電箱的設計。 網路、電話、電視訊號等訊號源會從弱電箱接入,再以此分散到住屋內的其他房間接孔。 我所在的大樓網路使用的是PPPoE架構。 連上網路線之後,必須要以帳號和密碼撥接成功才能上網。 因此最好在弱電箱配置一臺具備PPPoE功能的路由器,再由路由器提供NAT讓其他設備連上網際網路。 除此之外,這臺路由器還必須能夠塞到弱電箱裡面,而弱電箱的空間又會帶來其它問題。 具體來說,選擇弱電箱裡面的路由器時,其實有著諸多的考量:。 1. 能具備各種連結網際網路的能力,包括能夠提供PPPoE撥接的功能。 2. 狹小空間的要求:弱電箱的空間非常小,有些多天線的無線基地臺並無法塞入弱電箱。就算塞進去,無線訊號功能也等同浪費。 3. 無線功能的喪失:弱電箱的材質是金屬箱子,這會阻礙基地臺的無線訊號,基本上WIFI難以使用。 4. 散熱問題:大多時候弱電箱是關閉的狀態,意味著裡面的設備必須在不通風的環境下長時間正常運作。 在我意識到弱電箱的網路問題之後,我才發現許多家庭也有類似的困擾。 大部分家庭的做法都是把弱電箱的網路線路拉到外面,並將無線基地臺架設在弱電箱之外。 這種線路外漏的做法儘管不太美觀,但還是能夠具備提供PPPoE撥接、保有無線訊號、避免散熱問題等優勢。 # 無線基地臺的方案 / Wireless Access Point Solution。 https://www.dlinktw.com.tw/home/product?id=10116。 考量到居住空間的限制,我還是盡可能希望弱電箱的路由器能夠好好地住在弱電箱裡面。 因此我找了一臺D-LINK M15 AX1500 Wi-Fi 6 Mesh 雙頻無線路由器放進了弱電箱,搭配交換器讓其他房間能夠連上路由器。 ---- 繼續閱讀 ⇨ 雜談:弱電箱換上了MikroTik路由器 / TALK: I Placed a MikroTik Router in the Low-Voltage Wiring Box https://blog.pulipuli.info/2025/01/talki-placed-a-mikrotik-router-in-the-lowvoltage-wiring-box.html
看看網頁版全文 ⇨ LLL開發平臺「畢昇」實測:令人驚豔的溯源定位功能 / LLL Development Platform "BISHEN" Hands-On: Impressive Source Locating Function https://blog.pulipuli.info/2025/02/lll-development-platform-bishen-hands-on-impressive-source-locating-function.html 雖然大家都知道RAG可以將檢索結果交給大型語言模型回答,不過到底交給大型語言模型的是那些檢索結果?這些檢索結果又對應到那些文件?LLM開發平臺「畢昇」在檢索功能漂亮地解決了上述的問題,應可成為RAG應用中值得參考的標杆。 While everyone knows that RAG can submit retrieval results to large language models (LLMs), what exactly are those retrieval results submitted to LLMs? And which documents do these retrieval results correspond to? The LLM development platform, BISHENG, elegantly addresses these questions in its retrieval function and can serve as a valuable benchmark for RAG applications.。 ---- # 畢昇:大型語言模型開發平台 / Bisheng, LLM Development Platform。 https://github.com/dataelement/bisheng。 畢昇是一個開源的大型語言模型 (LLM) 應用開發平台,由北京數據項素智能科技有限公司開發,並以Apache 2.0授權。 畢昇目標是讓 LLM 應用開發更快速落地,幫助使用者更有效率地進入新一代的應用開發模式。 畢昇的名字取自活字印刷術的發明人,象徵這個平台如同活字印刷一樣,具有革新知識傳播的潛力。 畢昇平台提供豐富且完整的功能,包含生成式 AI 工作流程、基於檢索的生成 (RAG, Retrieval Augmented Generation)、代理 (Agent)、統一模型管理、評估、監督式微調 (SFT, Supervised Fine-Tuning)、資料集管理、企業級系統管理、可觀察性等等,致力於簡化開發流程並提升效率。 # 測試網站 / Demo Site https://bisheng.dataelem.com/。 如果想要測試畢昇的效果,可以直接到此網址,用帳號跟密碼就能夠申請。 ---- 繼續閱讀 ⇨ LLL開發平臺「畢昇」實測:令人驚豔的溯源定位功能 / LLL Development Platform "BISHEN" Hands-On: Impressive Source Locating Function https://blog.pulipuli.info/2025/02/lll-development-platform-bishen-hands-on-impressive-source-locating-function.html
看看網頁版全文 ⇨ 雜談:課程網頁的變遷 / TALK: Changes in Course Web Pages https://blog.pulipuli.info/2025/02/talkchanges-in-course-web-pages.html 我的課程網頁從Google Doc、Google Doc網頁、Google Doc Publisher,到現在終於進入到Google Sites了!這篇就來講講這段期間我設置課程網頁方案的演進吧。 ---- # 為什麼不用學習管理系統? / Why Not Use a Learning Management System?。 我知道,我知道,對,沒錯。 畢竟我的一部分專業領域也是數位學習(e-learning),當然不可能不知道學習管理系統的重要性。 學習管理系統能做到教材的管理、授課和修課同學的管理、評分的管理、權限控制和活動公告的管理等等。 現在不僅是線上學習,就連實體教學也多會使用學習管理系統。 對許多人來說,如果需要將教材上傳到網路、供學生觀看的話,那學習管理系統就是唯一的選項。 不過這個做法在有些時候不見得是好事。 由於我三不五時就需要出去演講。 演講的過程需要將教材提供給學員觀看,或是提供相關教材讓學員下載、操作。 此時有一個統一管理教材跟內容的網頁是很重要的做法。 學員只要透過這個網頁就能查看教材本身,不需要再花時間註冊帳號,立刻就能用網頁來上課。 這點對於學習管理系統來說就很難做到。 學習管理系統的運作原理都是綁定在記名身份上,而匿名瀏覽並不是它的主要用法。 另一個原因是我需要對自己創作的教材作知識管理。 最基本的做法,是用Google Drive的檢索功能查找過去所製作的投影片或教材。 這樣下次要製作類似主題的內容時,才能從過去的教材繼續改進。 而學習管理系統大多時候是要求教師上傳檔案,擺在學習管理系統上供學生下載。 當學校空間不足的時候還會要求教師整理檔案內容。 由於有知識管理的需求,我並不傾向在學校的學習管理系統上傳檔案。 當時我折衷的做法是提供Google Drive的連結供學生下載而已。 當然,我知道很多人也會用GitHub或其他的架站空間來擺放教材。 不過將檔案分散在各地的做法,未來往往會找不到當初做的資料擺放何處。 因此我也是比較不傾向這種方式。 由於上述兩點考量,比起複雜的學習管理系統,我更需要的是能可公開瀏覽的課程網頁方案。 除此之外,如果還能夠簡單地編輯,以及能夠讓我用Google Drive等方式搜尋到,那就更好了。 ---- # Google Doc的公開瀏覽 / Public Access in Google Docs。 一開始我的想法還蠻簡單的。 ---- 繼續閱讀 ⇨ 雜談:課程網頁的變遷 / TALK: Changes in Course Web Pages https://blog.pulipuli.info/2025/02/talkchanges-in-course-web-pages.html
看看網頁版全文 ⇨ 演講投影片:大型語言模型在工業領域的潛力 / Slide: The Potential of Large Language Models in Industrial Fields https://blog.pulipuli.info/2025/02/slide-the-potential-of-large-language-models-in-industrial-fields.html 大型語言模型(Large Language Model)成為AI浪潮之後下一個新的寵兒,它彷彿真人般的對談和創造力的發想對研究和教育上帶來了無數啟發。 但是大型語言模型在要求精確的工業領域裡面,究竟可以扮演什麼角色呢?本次演講先講述工業5.0發展中對於大型語言模型的需求,再來講述工業領域應用大型語言模型的實例,最後介紹大型語言模型和檢索生成增強的相關技術作為結尾。 如果你也想在產業應用大型語言模型的話,不妨先看看這份投影片,瞭解一下現況吧。 Large Language Models (LLMs) have become the next big thing in the wake of the AI wave, offering human-like conversation and creative brainstorming that have inspired countless research and educational endeavors. But what role can LLMs play in demanding industrial fields that require precision? This presentation will first discuss the need for LLMs in the development of Industry 5.0, followed by examples of LLM applications in industrial settings. Finally, it will conclude with an introduction to related technologies like Retrieval-Augmented Generation. If you are also interested in applying LLMs in industry, take a look at this presentation to understand the current landscape.。 Short URL: https://l.pulipuli.info/24/nkust。 ---- # 演講簡介 / Introduction。 ---- 繼續閱讀 ⇨ 演講投影片:大型語言模型在工業領域的潛力 / Slide: The Potential of Large Language Models in Industrial Fields https://blog.pulipuli.info/2025/02/slide-the-potential-of-large-language-models-in-industrial-fields.html
看看網頁版全文 ⇨ RAG簡介投影片:現況、原理、發展 / RAG Introduction Slides: Current Status, Mechanisms, and Development https://blog.pulipuli.info/2025/02/rag-introduction-slides-current-status-mechanisms-and-development.html 這份投影片對檢索生成增強(Retrieval-Augmented Generation, RAG)的觀念作一個容易理解的介紹,也是「資訊檢索的AI革新:從資訊檢索到檢索增強生成」這篇的簡化版本。 一般說到AI大家都會想到創造力、彷彿真人的表現,但RAG本質上更接近資訊檢索的問題。 把它當作資料庫就很容易理解RAG的用途了。 This presentation provides an accessible introduction to the concept of Retrieval Augmented Generation (RAG), and is a simplified version of "The AI Revolution in Information Retrieval: From Information Retrieval to Retrieval-Augmented Generation". When people talk about AI, they often think of creativity and human-like performance, but RAG is essentially closer to the problems of information retrieval. Thinking of it as a database makes it easier to understand the purpose of RAG.。 Fixed Short URL: https://l.pulipuli.info/24/nccu/rag。 ---- # 投影片 / Slide https://docs.google.com/presentation/d/1MNCfPqZbz4G8Bg_k6qNqwoHTQpRi2a4sQQBATnDynUI/edit?usp=sharing。 - Google簡報線上檢視 - PDF格式下載 - Power Point (.pptx) 格式備份:Google Drive、SlideShare、GitHub、One Drive、Mega、Box、MediaFire、pCloud、4shared、ASUS WebStorage # 大綱 / Outline 1. 為什麼需要RAG 2. RAG如何運作 ---- 繼續閱讀 ⇨ RAG簡介投影片:現況、原理、發展 / RAG Introduction Slides: Current Status, Mechanisms, and Development https://blog.pulipuli.info/2025/02/rag-introduction-slides-current-status-mechanisms-and-development.html
看看網頁版全文 ⇨ 希希助教的情人巧克力會送給最認真的同學喔! / TA. Sissi's Valentine's Day Chocolates Will Go to the Most Hardworking Student! https://blog.pulipuli.info/2025/02/ta-sissis-valentines-day-chocolates-will-go-to-the-most-hardworking-student.html 你就是那位認真的同學嗎? ---- # 素材 / Material 這次背景的藝術字嘗試使用ChatGPT來繪製。 雖然ChatGPT跟Bing Image Creator背後都是使用DALL-E作畫,但ChatGPT感覺更容易透過對話脈絡來修正圖片呢。 真是厲害。 本來想要用封面圖產生機來製作,但赫然發現這好像還是太難了。 直接用圖片來編輯更快一點。 那這次就把邊框也做成素材,未來應該還可以繼續使用吧。 ---- 看看網頁版全文 ⇨ 希希助教的情人巧克力會送給最認真的同學喔! / TA. Sissi's Valentine's Day Chocolates Will Go to the Most Hardworking Student! https://blog.pulipuli.info/2025/02/ta-sissis-valentines-day-chocolates-will-go-to-the-most-hardworking-student.html
看看網頁版全文 ⇨ 雜談:我可以只要RAG的「R」嗎? / TALK: Can I Just Have the “R” in RAG? https://blog.pulipuli.info/2025/02/talk-can-i-just-have-the-r-in-rag.html 很多人以為RAG可以取代搜尋引擎,但其實很多人要的功能只有「能用自然語言檢索」而已。 ---- # RAG中的語意檢索 / Semantic Search in RAG。 RAG的全名「Retrieval-Augmented Generation」反映了它的整體架構。 其中第一步就是基於Retrieval找到相關資料的檢索。 很多人會以為RAG的檢索就一定是使用語意檢索。 而語意檢索又要經過分段(chunking)、製作語意向量(text-embedding)、保存到向量資料庫(vector database)等過程。 雖然RAG在實作的時候也可以有許多不同的變化,但於語意檢索已然成為了RAG受人關注的一大特色。 舉個例子來說,傳統的資料庫只能使用「關鍵字」檢索。 而且還不能輸入太多關鍵字,因為不太會有文獻能夠同時符合這麼多的關鍵字。 以往圖書館利用教育裡面,如何設定合適的關鍵字跟檢索策略,一直都是圖書館員在教學上的一大重點。 但是在語意檢索的架構中,使用者輸入的查詢語句不再受限於特定幾個關鍵字,而更可以使用自己常用的語言來輸入──在學術上,這種查詢方式叫做「自然語言」檢索。 此時輸入的查詢語句被轉換成了語意向量。 而查詢語句跟文件之間的比對,也從原本的關鍵字相符程度,變成了向量之間相似程度的計算。 當然,就算是在語意檢索的架構中,我們依然可以用「很不自然」的多個關鍵字來查詢,語言檢索背後依然會用同樣地邏輯來找尋具有相似語意的文件。 簡單來說,如果是探索一些模糊概念、或是你也不太記得明確的關鍵字的情況下,語意檢索的應用範圍其實已經可以取代傳統的關鍵字檢索了。 ---- # RAG中的R不是真正的檢索 / The R in RAG Is Not True Retrieval。 RAG使用了語意檢索,使得資料的搜尋可以突破「關鍵字」的限制,而使用「語意」來找尋文件。 然而這背後其實有兩大問題。 首先是很多人會質疑的「語意」,這到底是什麼意思?是誰來判斷「語意」?這時候工程的老師就會講說什麼類神經網路架構啦、Transformer架構啦、注意力機制啦之類會讓人聽到睡著的理論,最後跟你說這是Text Embedding模型決定的。 簡單來說,選擇能夠理解你使用文字的Text Embedding模型,是讓於「語意」檢索能夠成功的基礎。 ---- 繼續閱讀 ⇨ 雜談:我可以只要RAG的「R」嗎? / TALK: Can I Just Have the “R” in RAG? https://blog.pulipuli.info/2025/02/talk-can-i-just-have-the-r-in-rag.html
看看網頁版全文 ⇨ RAG應用方案:Google NotebookLM / RAG Application Solutions: Google NotebookLM https://blog.pulipuli.info/2025/02/rag-application-solutions-google-notebooklm.html Google NotebookLM已經成為使用RAG的最基本入門產品了。 它大幅拉高了RAG的競爭門檻。 沒有做的比Google NotebookLM好的話,都沒資格出來賣錢了。 這篇是我在介紹Google NotebookLM的投影片,供大家參考。 Google NotebookLM has become the most basic entry-level product for using RAG. It has significantly raised the competitive bar for RAG. If it's not better than Google NotebookLM, it's not worth selling. These are my slides introducing Google NotebookLM for your reference.。 ---- # 投影片 / Slide https://docs.google.com/presentation/d/1OePzM-5m5PRlH-OTSaIABFzj-dsFVYc88q37UQgBmtY/edit?usp=sharing。 - Google簡報線上檢視 - PDF格式下載 - Power Point (.pptx) 格式備份:Google Drive、SlideShare、GitHub、One Drive、Mega、Box、MediaFire、pCloud、4shared、ASUS WebStorage # 大綱 / Outline - Google NotebookLM簡介 - NotebookLM操作方式 - 進階分析 - 企業方案 - 使用案例 - 價格 # 內容 / Description https://notebooklm.google.com/。 我在這份投影片中,深入淺出地介紹了 Google 推出的 AI 筆記工具 NotebookLM。 這個工具結合了強大的 Gemini 模型,專為研究者、學生、創作者和專業人士設計,能有效提升學習與工作效率。 首先,我概述了 NotebookLM 的核心功能:使用者可以上傳多種格式的檔案,包含 PDF、Google 文件、網頁連結和 YouTube 影片(需字幕)等,讓 AI 根據上傳的檔案內容回答問題,並精確指出資料來源。 ---- 繼續閱讀 ⇨ RAG應用方案:Google NotebookLM / RAG Application Solutions: Google NotebookLM https://blog.pulipuli.info/2025/02/rag-application-solutions-google-notebooklm.html
看看網頁版全文 ⇨ 公視地方新聞資料集 / PTS NEWS Local News Dataset https://blog.pulipuli.info/2025/02/pts-news-local-news-dataset.html 最近我因為研究需求蒐集了公視新聞網地方新聞的一些內容,並把資料整理表格資料集,提供給有需要的人使用。 Recently, for my research, I collected local news content from the PTS News website and organized the data into a tabular dataset, making it available for anyone who needs it.。 ---- # 公視新聞網 / Public Television Service News Network。 https://news.pts.org.tw/category/11。 公視新聞網(PTS News Website)是公共電視文化事業基金會新聞部經營的網路新聞平台。 它提供即時的新聞報導、深度分析和專題節目,涵蓋國內外的重要事件。 公視新聞網的目標是提供一個獨立、中立且值得信賴的新聞來源,相較於其他可能被歸類為特定政治立場的媒體,公視新聞網比較強調它注重客觀與多元觀點呈現的特質。 它不僅是臺灣重要的公共媒體資源,也透過豐富多元的內容和積極的互動,努力滿足使用者對高品質新聞資訊的需求,並期許能成為一個值得信賴的新聞來源。 使用者可以用多種管道收看公視的新聞,而公視新聞網則是提供使用者這個網頁上瀏覽文字、圖片和影片等不同形式的新聞內容,並透過網站提供的導覽功能,快速找到自己感興趣的資訊。 公視新聞網的網站分類包含了「政治」、「全球」、「兩岸」、「地方」、「產經」、「文教科技」、「環境」、「社福人權」等類別。 而我這次蒐集的資料,就是來自於「地方」分類底下的新聞資料。 ---- # 公視地方新聞資料集 / PTS NEWS Local News Dataset。 - Google試算表:https://docs.google.com/spreadsheets/d/1lz6BdPbno6AMwbay8ud95ioplHBYMDGN4kZDE5ZEs-I/edit?usp=sharing - CSV格式下載:https://docs.google.com/spreadsheets/d/1lz6BdPbno6AMwbay8ud95ioplHBYMDGN4kZDE5ZEs-I/export?format=csv ---- 繼續閱讀 ⇨ 公視地方新聞資料集 / PTS NEWS Local News Dataset https://blog.pulipuli.info/2025/02/pts-news-local-news-dataset.html