很感谢minimax一声不吭偷偷改订阅,砍额度(疑似因为m3规模增加了)变相涨价,很多人闹又滑跪加上退款渠道。早就受不了这个刷分王蠢模型了,一年订阅的plus套餐,用了两个月总共成本70元左右,然后因为买多了还咸鱼找了人共享,实际成本40元。
https://openai.com/zh-Hans-CN/index/why-we-no-longer-evaluate-swe-bench-verified/
概括就是训练集里面混进了测试集,俗称刷分,benchmaxxed。
文章里提到的“预填”,感觉很有意思:调用api时假装模型先写一部分回复,可以起到诱导模型,甚至绕过安全限制的作用。即openai格式的messages里末尾项目role为assistant而不是一般的user。
测试了对minimax完全无效。而deepseek官方本来就支持这种功能,但是限制很少纯提示词就能写色色小说。
企图用这个实现一个超级丐版的webview,不自带浏览器内核,但是失败。测试版本v138 chromium,只要有其他浏览器窗口开着,就算指定了–window-size还是默认大小。而且不管怎么样都无法自动保存大小(使用–user-data-dir创建独立profile也无效)。
这下要完了,网上搜索了一圈查明了pixel领一年gemini会员的原理:
使用任意手机root后刷伪装build.prop模块伪装成pixel 10 pro,配上Play Integrity Fix和TrickyStore,然后去官方渠道领会员。(除了这些肯定还有风控,要注意ip地址,手机其他序列号等)
原来贩子的自动验证机器人是这种原理,怪不得有说法说皮鞋容易直接封号,毕竟查是不是学生要依赖外部验证,手机他们自己想仔细查就能查清。
万一小号被封还是挺麻烦的,这个小号都用成半个大号了
https://developers.googleblog.com/an-important-update-transitioning-gemini-cli-to-antigravity-cli
被合并进Antigravity CLI了,估计马上就会停止更新。今年6月18日停止普通用户的oauth接入方式使用(包括白嫖和pro等订阅套餐),商业用户key方式接入还能继续用。
试了下桌面版Antigravity,现在还很简陋。没有快捷指令等功能。修改代码在windows上还会出现编码问题,完成度远不如GeminiCLI,至于新出的AntigravityCLI我都不想试。
题外话,io大会上还发布了flash3.5模型。试用了下确实挺快的,肯定用上了最近给gemma配备的投机解码技术。但是巨幅涨价,然而不关我白嫖的事反正这么贵不可能买的
-
krrr 博主 : 终于蹬上a畜的claude opus模型了,果然高级自行车蹬起来就是省力啊
谷歌gemini学生认证掉了,要求重新验证了。本来是今年12月过期的。找了一圈,懒得ps学生证图片发给客服的话,还是用一点小钱摆平,15块弄个pixel手机认证续一年最省事。待我最后几天过了就去试试
https://one.idkey.cc/
-
krrr 博主 : 实验了,认证成功,覆盖了原来马上要到期的学生认证。商家用的pixel 10 pro手机,原理暂时不清楚为什么一个手机可以验好多号
最近网页设计流行清新的简约的,大片极浅色、大圆角、淡阴影风格。以tailwind css为带代表,不知道叫什么风格。
新开了一个项目,ng zorro默认圆角2px(几乎是直角了),高饱和度主色调,无所谓我也觉得挺好看的。反正设计就是一个个轮回,我的软件活到下一个轮回就又跟上潮流了嘻嘻
让ai自己写代码自己审查虽然听上去很蠢,但是实际上还是有点用的。前提是一定要清除上下文或者派subagent,不然它一定会自我合理化。这个比喻很精妙:一定要给它们安排隔开的座位(上下文)否则它们只会互相看答案抄袭。
虽然minimax m2.7性能和速度都被ds v4 flash一脚踹死,但是已经买了token plan了,只好站起来蹬了。让我研究研究完成任务后怎么自动触发审查,比如利用hook等……
盘古之白的间接受害者没想到是我。它和它的推崇者们就为了好看一点点,不厌其烦的,非常矫情的,没事找事的,在中文和英文及数字之间手动插入空格。数量如此之多传播之广,导致被LLM牢牢的学会了(千问)。
非编程的语境下,我传给LLM一个JSON列表让它帮我按照特定规则筛选数据。每个列表项目有个包含中文和数字的名称,作为标识符。
每次LLM返回给我标识符,都会非常稳定的在中文和数字中间插一个讨厌的空格,导致程序找不到列表项目。即使是用系统提示词强制它保持原样也没用,我也不想明说“不要加空格”那太丑陋了。
最后还是给每个列表项目赋值一个数字索引让它返回索引给我。
-
krrr 博主 : 本站一直开启text-autospace: normal。另外text-autospace: ideograph-alpha快要可以用了,火狐已经支持了