6/08/2026

(LLM Playground) 讓 Agent AI 們自己玩LM, 互相訓練跟學習

Claude Agent讓新來的Hermes Agent 當場社死現場🫣 

信誼-從爭吵引導是非觀|信誼好好育兒|信誼基金會|分齡教養,父母最佳幫手 https://share.google/MWKwoInH4EJFXp1x7


開party對於I人來說, 實在是個很累人的事情, 不過如果可以把訓練新進員工, 帶領組織朝著共同目標前進, 這種高空清談的事情, 就相對輕鬆很多 😎--> \0_(🐋🦞🤖😻)_o/

所以現在這個自動飛輪組織結構, 就變成了人的味道越來越少, 自主性agent跟互相協作的role-play默默地進行著, 以前電腦也可以選土豆, 現在電腦可以選人類不擅長的事情來做(像是互相debugging......還是看超長的文件與 test logs)


當一個agent 變成一個Agent AI組織後, 會發生甚麼有趣的事情(財經皓角)?

6/07/2026

(nVidia NIM Models) 意外發現有趣的nVidia開源模型試車市集

(mistralaimistralai/mistral-medium-3.5-128b) NIM API 體驗Prototype, 然後很意外大好用
喵娘Hermes Agent搭配Mistral-medium-3.5-128b 開啟Reaoning High,嘗試解決問題


以往要測試不同的LLM Model需要訂閱或是開API儲值超多家有的沒的的服務或是OpenRouter來導流. 不過現在有可以透過nVidia NIM Developer, 搭配Agentic AI來設定config就可以有效的驗證各家新東西. 

AIanalysis 模型最新的評比(透過各種CP比較, 周末裡面幾個開源模型Reasoning High來測試)

將手上的模型把已經建好的Skills套用這類開源模型後, 實際體驗下來只能說驚訝, 尤其是過往Production-Ready的都是基於Gemini-2.5-Flash/Pro這類穩定但沒有Reasoning或是MoE的,

5/31/2026

(Google IO後) Gemini 新版即將開啟 Apple Siri的新時代跟我的心Hermes Agent

最近在Google IO 後, 有在深度使用Gemini的社群第一時間除了哀鴻遍野, 後面Google團隊也釋出了許多彌補措施來平息眾怒, 後面慢慢地看到Gemini 3.5 Flash真正的實力, 我自己有感的強項有:

1. GO語言原生種! (這個語言對比過往Node.js...透過Gemini寫的跑起來有效率多很多, 尤其適合老NB或是小記憶體的VPC)

2. 快速? 雖然這有時候反而是災難起點

3.便宜, 沒錯Gemini 就是最便宜又節省算力的第一首選(TPU對比GPU訓練的模型)但這也造成了她的缺陷(腦缺氧帶來偶而的幻覺...>ㄡ<)


arsTechnica Apple working to cram massive Gemini model into iPhone to power new Siri