6/07/2026

(nVidia NIM Models) 意外發現有趣的nVidia開源模型試車市集

(mistralaimistralai/mistral-medium-3.5-128b) NIM API 體驗Prototype, 然後很意外大好用
喵娘Hermes Agent搭配Mistral-medium-3.5-128b 開啟Reaoning High,嘗試解決問題


以往要測試不同的LLM Model需要訂閱或是開API儲值超多家有的沒的的服務或是OpenRouter來導流. 不過現在有可以透過nVidia NIM Developer, 搭配Agentic AI來設定config就可以有效的驗證各家新東西. 

AIanalysis 模型最新的評比(透過各種CP比較, 周末裡面幾個開源模型Reasoning High來測試)

將手上的模型把已經建好的Skills套用這類開源模型後, 實際體驗下來只能說驚訝, 尤其是過往Production-Ready的都是基於Gemini-2.5-Flash/Pro這類穩定但沒有Reasoning或是MoE的,

5/31/2026

(Google IO後) Gemini 新版即將開啟 Apple Siri的新時代跟我的心Hermes Agent

最近在Google IO 後, 有在深度使用Gemini的社群第一時間除了哀鴻遍野, 後面Google團隊也釋出了許多彌補措施來平息眾怒, 後面慢慢地看到Gemini 3.5 Flash真正的實力, 我自己有感的強項有:

1. GO語言原生種! (這個語言對比過往Node.js...透過Gemini寫的跑起來有效率多很多, 尤其適合老NB或是小記憶體的VPC)

2. 快速? 雖然這有時候反而是災難起點

3.便宜, 沒錯Gemini 就是最便宜又節省算力的第一首選(TPU對比GPU訓練的模型)但這也造成了她的缺陷(腦缺氧帶來偶而的幻覺...>ㄡ<)


arsTechnica Apple working to cram massive Gemini model into iPhone to power new Siri

5/18/2026

(Harness Engineering) 打造自己信賴的輪子 Zero Trust Architecture Agentic AI

關於AI加速的時代, 除了在台灣的大家明顯的感受到股市大好的事情跟連學生們都在餐廳談說他們的台積電賺了多少(.....沒錯.....連國高中生都ALL IN台積了) ...

近期在矽谷莫名的燒token潮中, 這個訪談中提到了這點~同時當我讀到 Anthropic 的《創辦人手冊》時,有一句話深深擊中: 「從點子到發布的時間,已經從 6 個月壓縮到了 1 天。」

過去這幾個月,完全活在這樣的節奏裡。但親身體驗這種速度,也讓人感到一絲恐懼。這讓人想到 YC 執行長 Gary Tan 最近對於使用 Agentic AI (代理式 AI) 的絕佳比喻:這就像是在開一台法拉利。 速度極快、令人血脈賁張。但它終究有一天會在路邊拋錨,而這時*「你最好是個懂得打開引擎蓋、親手把車修好的技師」。*