6/08/2026

(LLM Playground) 讓 Agent AI 們自己玩LM, 互相訓練跟學習

Claude Agent讓新來的Hermes Agent 當場社死現場🫣 

信誼-從爭吵引導是非觀|信誼好好育兒|信誼基金會|分齡教養,父母最佳幫手 https://share.google/MWKwoInH4EJFXp1x7


開party對於I人來說, 實在是個很累人的事情, 不過如果可以把訓練新進員工, 帶領組織朝著共同目標前進, 這種高空清談的事情, 就相對輕鬆很多 😎--> \0_(🐋🦞🤖😻)_o/

所以現在這個自動飛輪組織結構, 就變成了人的味道越來越少, 自主性agent跟互相協作的role-play默默地進行著, 以前電腦也可以選土豆, 現在電腦可以選人類不擅長的事情來做(像是互相debugging......還是看超長的文件與 test logs)


當一個agent 變成一個Agent AI組織後, 會發生甚麼有趣的事情(財經皓角)?


不過當開始為了要讓彼此對接, 燒了太多的token跑Deepseek API, OpenAI API, Claude API 跟Gemini API (尤其Soonet 4.6, 3.5-Flash是聰明又很快沒錯, 但也因此燒太多Token (!$🎲🪄🫣了....) 玩過了Tokenmaxxing的流程把橋做好了, 後面還有好幾個禮拜等重置, 只能先拿OpenAI的免費額度跑小型模型跟佛心的Gemini API跑 Gemma 4挺過後面三周.(前提是不要有甚麼大的🛞🪐)

Gemini API key有免費的Gemma 4可以每天使用

大語言模型已經感覺進到了一個神秘的階段, 有些開源模型的評測可以發現混合使用的情況(所謂的蒸餾), 再搭配MoE就已經讓免費的做到在不寫code的任務上, 跟付費的幾乎一樣好.

Grok, Claude, ChatGPT, Gemini 最近的評比- GPT5.5

身為開發者社群吃瓜群眾, 當然可以預期的是我們可以在那邊看練蠱人互相傷害, 然後希望不會出現一個超大的LLM吃掉整塊市場. 有些事情, 有些AI真的做起來比人做得好很多(當然有些AI真的是做得超爛....參照下圖~)


沒有留言:

張貼留言

謝謝您的留言, 我會在收到通知後盡快回覆您的.
Thanks for your comment. l may reply once I got notification.