Tag
我们似乎习惯了盯着冷冰冰的跑分榜kan谁geng强。但说实话,那些数字真的Neng代表我们在真实场景里的体验吗?有时候,网上吹得天花乱坠的模型,实际一上手交互,你会发现它笨得可爱;反倒是那些名不见经传的家伙,往往Neng在某个瞬间给你一种“这玩意儿成精了”的错觉。 为了验证这种直觉,我和朋友焕东搞了个大胆的实验:我们不想Zuo那种只会一本正经回答问题的AI,我们要把大模型扔进一个高压、充满谎言
查看更多 2026-04-22
Demand feedback