艾格尼丝·风子的精良准确杂谈楼

本楼和本站一样没有任何目的,主要是分享一些 muxing 的一些无关紧要的学习、读书、读论文的杂感。那为什么叫艾格尼丝·风子的,是因为前段时间重温了《好兆头》,里面的女巫艾格尼丝·风子 (Nutter) 写了一本书叫《艾格尼丝·风子的精良准确预言书》,这本书做出了直到世界末日的几百年中所有大小事件的精良准确的预言,这本书是传世孤本,而她的后人以解读她的著作为职业。把本楼命名为艾格尼丝·风子的,既是勉励笔者自己能写出精良准确的杂谈,也是因为风子便是疯子 (Nutter),就是荒诞。

4 Likes

万事开头难,先更一段《资治通鉴》作为开头吧,《资治通鉴》是本好书,但是中间五胡十六国的内容太长太难读了。未来几天,笔者主要脉络放在《指环王》上。

恰好读到了五胡十六国时期,公元 403 年,北魏正在山西、河北的北部快速兴起,南边还有碎了一地的燕国和畜生姚氏的后秦。北魏的国主拓跋珪有武力和谋略,对外用兵都非常成功,对国内却施行高压政策,经常杀不致死罪的大臣。这里是和跋之死:

原文:
平原太守和跋奢豪喜名,珪恶而杀之,使其弟毗等就与诀。跋曰:“灅北土瘠,可迁水南,勉为生计。”且使之背己,曰:“汝何忍视吾之死也!”毗等谕其意,诈称使者,逃入秦。珪怒,灭其家。中垒将军邓渊从弟尚书晖与跋善,或谮诸珪曰:“毗之出亡,晖实送之。”珪疑渊知其谋,赐渊死。

翻译:
平原太守和跋,为人奢侈,爱好虚名,拓跋珪很是讨厌,于是把他杀了,在临刑的时候,允许他的弟弟和毗等人与他见面做最后的诀别。和跋说:“灅水以北,土地贫瘠,因此,你可以迁到灅水的南面居住,在那里还能够勉强维持生计。”并且,让他背对着自己,说:“你怎么会忍心看着我死!”和毗等人领会了他的用意,于是便假装以朝廷的使节自称,逃往后秦避难。拓跋珪非常生气,将和氏全家杀掉。中垒将军邓渊的堂弟尚书邓晖素来与和跋交好,所以,有人向拓跋珪密告了这个情况,说:“和毗逃走时,其实邓晖曾秘密送行。”拓跋珪怀疑邓渊知晓和毗等人的图谋,便命令他自尽。

评论:
和跋是一个对北魏开国有很大贡献的人,他们家族也非常兴盛。此前拓跋珪曾经劝过和跋不要奢侈,但是和跋没听。如果在和平时代,即使遇到一个拓跋珪这样刻薄的人,或许是如同汉明帝一样,那也不至于惹来杀身之祸。但是,哪有如果,这是乱世,社会矛盾非常尖锐,遇到的国主也不是像苻坚那样开明的人物,和跋便走向了死亡的命运。
灅水南北指后秦和魏国,土地贫瘠与维持生计指政治环境非常恶劣与不那么恶劣。和跋临死,劝家里人出逃到后秦,还要做出灅水南北这样复杂的暗示,万幸和跋和他弟弟都足够聪明,能理解这样的暗示,乱世中总算留下来一条性命。
宏观上来看,社会矛盾尖锐的时候,人要活命只能走向不犯错,不犯错就只剩保守一条,于是社会矛盾尖锐的时候,保守主义盛行。微观上,和跋不那么审时,也不那么会揣摩自己的国主,为自己和族人朋友都招来了如此大祸。

1 Like

黄金森林中,精灵的堕落与救赎

指环王,应该算是托尔金笔下最完整的一个故事,里面展现了中土大陆第三纪元末的诸多风貌。

其中或许夏尔的生活方式可以引起很多人的向往,不过笔者最感兴趣的还是精灵。当年看电影笔者被莱格拉斯迷得五迷三道:drooling_face:,可惜只有那三部电影中的小叶子是好看到令人垂涎的,唉,岁月。

笔者这是重读指环王,跟随护戒远征队到达 黄金森林,彼时远征队队长甘道夫和炎魔一起落入无底深渊,几乎没可能活下来;远征队经历了大雪山的封锁、墨瑞亚漫长的跋涉和战斗已经疲惫至极。大家在黄金森林休整了一段时间,可能以往的读者更关心黄金森林的美景和远征队的休整本身,但忽略了在这里体现出来的高等精灵的堕落和救赎。

黄金森林的精灵对魔戒大战和世界的看法是这样的:
“我们当中有些人唱道,魔影将会消退,和平将会重返。但我相信,我们周围的世界,届时并不会变得跟古时一样,太阳的光芒也不会再如往昔一般。至于精灵,恐怕最好的情况也不过是一个休战的协定,而他们会遵循协定,不受拦阻地前往大海,永远离开中洲。可叹我心爱的洛丝罗瑞恩啊!在一个没有瑁珑树生长的地方,生活将是多么贫乏无趣!纵使大海彼岸有瑁珑树,也从来没有人提起。​”
弗罗多作为持戒人,此时已经有了远超其他人的观察力,他对两处精灵居所的评价是这样的:
他一踏上银脉河的对岸,就有种奇怪的感觉临到了他,而随着他继续走进这耐斯,这种感觉也愈来愈强烈:他觉得自己像是走上了一座时间之挢,进入了远古时代的一个角落,如今正在一个不复存在的世界里行走。在幽谷,有的是古老事物的记忆;而在罗瑞恩,古老事物仍活在这个现实世界当中。这里见过也听过邪恶,并经历过悲伤;精灵害怕并且不信任外面的世界。
幽谷就是瑞文戴尔,罗瑞恩就是黄金森林。

两处精灵居所的共同之处是都有对远古时代的怀念,只是黄金森林做的更加过分,黄金森林用水之戒能雅保留了远古时代的遗迹。这固然有情有可原之处——精灵们都会随着大地日渐衰老,精灵们的智慧和哀伤也与日俱长,因此所有精灵都会尽量保留和回忆美好的事物——也是精灵们与索隆合作制作魔法戒指的原因,精灵将医治大地的创伤与保留远古的遗留混为一谈,他们的所有戒指本质上也只有一种能力:防腐。黄金森林的精灵将使用能雅戒指防腐的力量发挥到极致,他们似乎将这片森林与外界隔开,这里万物有了自己的时令,古老的树木几乎得到了永生,这里的精灵也越发不肯面对世界的变化。

而精灵态度的转变其实也已经开始,这里我认为是以加拉德瑞尔夫人作为一个代表发生的,她经受了魔戒的考验。这是在考验开始前的一段对话:
“大敌心中怀疑,但他并不确知——还不确知。现在,你懂得为什么你的到来对我们来说是末日的足音了吧?如果你失败了,我们将暴露在大敌面前,被他一览无遗。但是,如果你成功了,那么我们的力量就将衰微,洛丝罗瑞恩将会淡褪,时间的潮水会将它冲刷殆尽。我们必须离开前往西方,否则就会衰落成山谷中、洞穴里的原始族群,慢慢忘记过去,并且被人遗忘。​”
弗罗多低下了头。​“那你希望怎么样呢?​”他最后说。“顺其自然。​”她答道,​“精灵对自己的土地与成就的爱,深逾大海之渊,他们的遗憾将永不消逝,也永远不会彻底平息。但是他们宁可抛弃所有这一切,也决不肯顺从索隆——因为他们现在已经认识了他的真面目。你并不对洛丝罗瑞恩的命运负有任何责任,你惟一要负责的就是你的任务。只是,尽管无济于事,我仍愿至尊戒从未被铸造出来,或永远失落无踪。​”
精灵实际上已经在某种程度上做出了取舍——纵然弗罗多的到来无论如何都意味着精灵的衰微、黄金森林的消失,但是他们宁愿抛弃这一切,也不屈从于索隆。只是,这个取舍是够的吗?精灵依然认为用戒指的力量防腐,对抗规律是正确的。而魔戒的考验开始的时候,进一步的转变到来了:

“加拉德瑞尔夫人,你有智慧,既无畏又美丽。​”弗罗多说,​“如果你要,我会把至尊戒给你。它对我来说实在是个太大的麻烦。​”

(加拉德瑞尔)“而现在机会终于来了。你心甘情愿,要把魔戒送我!你将会拥立一位女王,来取代黑暗魔君。我不会是黑暗的,而会既美丽又恐怖,如同清晨与黑夜!美丽如同大海、太阳以及圣山之上的白雪!恐怖如同风暴和闪电!强壮坚实胜过大地的根基!众生万物都将爱我,并将绝望!”她举起手来,她所戴的戒指发出了一道极亮的光,只照亮她一人,其余一切都落在黑暗中。此刻她站在弗罗多面前,显得高不可测,美不能胜,既恐怖又尊贵。接着,她任由那只手垂落,那道光消失了。突然间,她又大笑出声,哎呀!她缩小了——又变成一个修长苗条的精灵女子,裹着质朴的白袍,温柔的声音既轻软又悲伤。“我通过了考验,​”她说,​“我将衰微,并前往西方,依旧是加拉德瑞尔。​”

弗罗多给了她另一个选择:获得至尊戒,既可以干掉索隆,也不至于精灵三戒力量消失。这个选择非常有诱惑力,因为加拉德瑞尔是第三纪元最强大的生物之一,拥有足以驾驭魔戒的力量,而不至于被魔戒驾驭。

为什么加拉德瑞尔放弃了?这里只能猜测。笔者认为是加拉德瑞尔意识到了,魔戒虽然可能拥有防腐的力量,但是也伴随着贪欲,不迎合自己理念的人终将会抗争,最终自己愿意保护的大地却毁在自己的手里。这又是另一个更加悲哀的结局——无论如何,无论弗罗多到不到来,无论自己能不能获得魔戒,最终的结果一致——大地继续衰老,精灵终将衰微。而放弃获得这近在眼前的力量,虽然痛苦,加速她的到来,但是至少她深爱的大地没有因自己受到更多伤害,自己还是自己。或许,她还能有了更多的豁达,或许,变化的世界没有那么糟糕呢?

最终,精灵一族态度转变了,他们愿意放弃全部戒指的力量,然后西归,我认为这是精灵的救赎。这个选择不比露西恩放弃精灵的身份、埃雅人迪尔踏上去维林诺的旅途、弗罗多选择护送戒指渺小,这个选择也可以说是魔戒最终一定能被销毁的理由之一——或许不算承认铸造戒指是错误的,但他们终于肯放手了。

3 Likes

关于赵鑫教授对 RL+LLM 强的评论

赵鑫教授在小红书上经常发表科研上的见解 (其个人主页:https://xhslink.com/m/3HryY7vUj3Q)

个人认为他的见解都非常有参考价值。今天中午他说的三条:

LLM+RL 最近论文比较水了,特别是数学推理。从数学模型、ds 蒸馏模型、推理模型出发整体上很容易激活数学能力,很多都基于这些强模型做花活,但 5 个点以内的提升没啥用;从基座模型很难到达相同水平,这是看真正内功。
接上一条,浇浇 RL 的冷水。目前来看,RL 和 SFT 只是两种重要的微调方法。由于奖励信号、探索能力等问题,RL 目前的局限性还很大。原来不行的模型,RL 也带不起来。在 LLM 这里,RL 会很有用,但起作用还是很依赖基座的提升。
再接一下,RL 目前在大模型训练中最核心的两个问题就是奖励模型和探索策略。这两个东西都严重依赖基座模型,所以到现在为止 self-play 还是非常困难的,绝大部分这类工作感觉也是在雕花打补丁,不是最终的解决方案。

他说的有道理,他认为目前的研究基于激活大语言模型数学、推理能力本质上是基模型的能力。由此推出的观点应该是提升基模型的能力

我认为和他不太一样的观点是,强化学习本身的内功并没有彻底发挥出来,只是个人目前手头忙着其他工作,并且没什么算力,很难说出具体如何让强化学习的功力发挥出来。

2 Likes