4/14/2026

(Hackway) Harness Engineering來找出任務導向的模型

對於一直拆解任務導向的同時, 覺得越來越難處理的問題是如何讓自己的大腦或是認知跟上AI的認知邊界(然後會越來越累....尤其要有意識的多模型互相稽核), 後面標準與自動化打包的流程反而是最輕鬆的, 對的事情簡單做, 簡單的事情重複做. 

Openclaw Harness with various LLM models

Openclaw裡面models可以有這些


對於現在隨時都可以把Harness拉上線的今天(WhatsApp or Telegram), 停車的時候就可以把問題或想法丟給openclaw 做實驗驗證或是找MCP service的資料庫來尋找連結, 實際體感的過程中覺得最能夠發想找出關聯的創意大師是Deepseek(Reasoner), OpenAI則是第二. 儘管有時候太超過讓人覺得他們是不是進入幻想了,但是他真的很會寫作與找關聯進一步創出新的skill set. 然後對任務保持的極度理性則是Claude. 在兩個極端中間的平衡表現則是Gemini3,與 2.5_flash

ISO27001, NIST compliance audit finally all PASSED

後來小金老師的最新影片有學術論文也真的提供這件事的確存在, 跟體感大致一致:


  

如果說這個時代要甚麼有甚麼的今天, 如何有效識別甚麼時候要使用大模型來打, 甚麼時候用小模型就可以了, 架構一個有效率的任務導向的OS Harness, 可能是更為重要的Appolo-11的原始碼精省哲學跟當年超慢的CPU就可以登月了, 那我們為什麼用今天的電腦或是手機還不能夠有效的駕馭它早已過剩的效能>.< ( QA 跟Account Project Manager技能包已經寫完了, 剩下來的技能開發要寫甚麼?該不會要把鳳凰計劃拿來寫吧....雖然有寫日記的習慣但是要把記憶上傳這件事還是在等等好了) 

Gemini -2.5-Flash-lite(系統穩定後的好朋友)



先把正在讀的工具書覺得訓練時還蠻有用的筆記備註下來,當寫harness ideas:

1. Frameworks for Thinking

2. Dunlingo Handbook

3.An Introduction to Habits of Mind and Foundational Concepts


沒有留言:

張貼留言

謝謝您的留言, 我會在收到通知後盡快回覆您的.
Thanks for your comment. l may reply once I got notification.