第337章 泼天的富贵(5021) (第2/2页)
柚子科技也确实并没有完整清洗有问题的数据,而且全部的数据也确实都已经被学习了。
之所没有出问题,是橘子大模型训练时所使用的,内部版本柚子训练框架中内置的“辩证对抗网络学习系统”,和橘子大模型输出端的“陈皮输出防护系统”共同作用的结果。
目前公开版本的橘子大模型2.5N只是柚子科技研发服务器中1.5万亿参数大模型的一个子集,这个1.5万亿参数的大模型,其中具备的一个神经网络对抗模块就叫做“辩证”。
这里的“辩证”并非严格的哲学概念,而是基于对抗性验证的技术过程。
橘子大模型在学习“非逻辑类的观点性数据”之前,会先行根据掌握的既有知识对即将学习的这个观点制作反题来进行反证。
若反证不成立,判断此数据为真,大模型进行学习;若反证成立,则看这两者之间是否有共通性,不存在共通性,则抛弃这部分数据;若存在共通性,则吸取其共通性进行学习。
这种学习方式,和黑格尔提出的“正题-反题-合题”三段论非常类似,因此被命名为“辩证”系统。
那些错误的“观点性数据”,在“辩证对抗网络学习系统”下,大部分都被“反题”反证了。
没有反证的,也通过“合题”改变了其观点强度根本不可能对橘子大模型构成“思想钢印”。
大部分都被“反题”反证了,没有反证的,也通过“合题”改变了其观点强度。
“陈皮输出防护系统”则是完全独立于橘子大模型之外的一个小模型,这个小模型并不负责任何内容生成,只负责在“观点性”数据输出前对结果进行验证,确保不会输出被恶意操控或受偏见影响的内容。
值得注意的是,“陈皮”系统只验证“观点性”的输出数据,对伦理、价值观或敏感话题之外的“非观点性”数据并不进行验证。
相当于用户向橘子大模型提出非科学性而是“观点性”的请求时,返回的结果并不是由橘子大模型直接返回的,而是经过“陈皮”的验证后,返回到用户界面。
这样,就大大降低了柚子科技大模型的对齐难度,同时提高了因“验证”而降低的模型运行效率,并且降低了算力消耗。
“陈皮”系统的这种选择性审核机制实际上是一种精细控制的对齐机制,它可以有效解决AI对齐中的复杂性。
通过将对齐问题集中在观点性问题上,而对数理逻辑问题则放宽对齐标准,既能提高效率,又能保持伦理和价值观的一致性。
在此前,方豫和柚子就已经发现,如果在预学习阶段就频繁要求大模型进行对齐,最终模型的推理性能会非常差,甚至会因为对齐要求与基本逻辑存在冲突而完全无法进行推理。
因此,方豫最终决定将对齐的方式完全剥离出来。
说白了,就是学习的时候你随便学,学什么都行,推理的时候也爱怎么推理就怎么推理,但真正输出“观点”的时候,除了大模型自己衡量是否可以输出外,还增添了一道双保险。
这道双保险,就是“陈皮输出防护系统”。
有了这两道保险,千寻的这些小伎俩根本不会产生任何效果。
反倒因为千寻先行向柚子科技开战,而让方豫在阵营立场上获得“大义”,可以毫无顾忌的对千寻展开全面反击!
——
“千寻已无法登陆,‘内容管理’失效已非首次。”
“主动失效?or被黑?”
“正义只会迟到,不会缺席,一文解析千寻的前世今生”
“千寻背后的意图”
……
从早上九点千寻尚未全停机检测前,关于千寻“内容管理”失效的帖子就占据了至少3条热搜。
而在早上十点千寻正式全停机检测后,相关话题更是垄断了热搜前十中的五个词条!
千寻居然真的无法登陆了!
尽管千寻过去六年也曾发生过两次大规模的无法登陆事件,但那两次攻击者采用的都是DNS污染的方法,千寻并未真正停机维护,就算千寻自己不解决,用户通过修改DNS或者修改hosts文件都能够解决。
但这一次可是彻底无法访问的全停机检测!
作为大周互联网基础设施的千寻,居然会出现这种问题,根本就是不可能的事情!
微博上甚至相当一部分人都在猜测,千寻是不是故意的?
去年和前年,千寻遭遇舆情危机的时候,都曾经用过这一招,也难怪别人会这么想。
跟碧琪公主似的,不被绑架就不舒服?
没有公主命,得了公主病。
howoldareyou?
微博上说什么的都有,维信的各个群里更是讨论的热火朝天。
“卧槽!千寻真的上不去了!昨天晚上传的截图是真的?”
“什么昨天晚上,那是今天凌晨。”赵攀峰看着群里面的发言,忍不住跟了一句,“当时我正加班,话说你们这神经也太恐龙了吧?千寻都停机了才开始讨论?我进了个老年群?”
“活该啊,千寻这种吃人血馒头的公司活该倒闭!”
“你想多了吧?千寻倒闭?去年千寻暂停服务四个小时,最后不是也恢复了?”
“各位,我不管它恢复还是不恢复,我下午两点就得给上面交材料,千寻上不去,我材料怎么写?”
“土豆哥还亲自写材料呢?现在谁写材料还搜千寻啊,都是直接AI了。”赵攀峰看到群里的体制内大佬发言,赶忙凑上去,实际上他也没真正用过AI。
“AI我不会啊,之前用过两次免费的,效果不好,听别人说得自己训练调试,我也不懂。谁帮帮忙,还有哪个搜索引擎能用?”
“搜苟、必赢,哦,对了,还有Y搜,我最近一直用Y搜。”赵攀峰立刻炫耀,实际上他也是几个小时前才第一次用的Y搜。
“Y搜的搜索质量确实高,凌晨我加班,本想用千寻搜个背景信息,结果没搜出来,Y搜一搜,就按照我的需求给我生成了一组链接集合,里面我想要的链接都给我汇总好了,非常省事。”
“真的?网址多少?”体制内大佬发了个问号表情包。
“就是,一个字母,简明扼要。”赵攀峰直接在群里面给了网址。
“哦,那我试试。”
名叫土豆哥的体制内大佬重新进入潜水状态。
类似的对话发生在无数球球群和维信群叮叮群中,其他各种搜索引擎的使用度全都在大幅度的提升!
“再新增两组服务器!”
章向铮满脸亢奋的看着面前屏幕上的服务器负载界面,毫不犹豫的对手下下达了一个指令。
从早上十点零八分千寻停机到现在,不过短短一个小时,720搜索每秒钟的国内搜索次数就从三千次上升到了一万两千次!
尽管仍旧只是千寻高峰时间段每秒六万次搜索次数的五分之一,但千寻本身就占据了大周百分之七十八的搜索市场占有率,一万两千次的搜索次数,已经相当于百分之十五的市占率!
这对于原本连百分之五市占率都没有的720搜索来说,简直就是泼天的富贵!
作为720搜索的负责人,在得知千寻“内容管理”措施失效后的第一时间,章向铮就敏锐的察觉到了机会,立刻扩充了服务器负载。
果然,在千寻真正全停机检测的第一时间,数倍于此前的流量就通过捆绑安装了720浏览器和被流氓软件修改了主页面的用户,流向了720的搜索服务器。
泼天的富贵啊!
一定要把这批用户牢牢留住!