核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
2024年下半年,又看到这个问题。 从2017年工作到现在...
就不想用rust吗?局面打开,j***a写一堆class太臃...
最关键是做不大。 CRT最后的绝唱出现在08年,当时一波看...
一个成年人单日呼吸次数2~2.5万次,单日消耗氧气量约550...
人在美国,讲一个office神奇的地方, 办公室和公司发的电...
本文参考LLaDA:Large Language Diffu...