Life is a Struggle.

其实那天晚上还听了一个中科院动物所老师的报告
里面有一个很牛逼的想法,虽然老师只是一嘴带过,他们也没有在做这个方向
就是用 GPT 的方式来处理基因
当时听报告的时候我只是笑了一下,觉得这个想法脑洞还挺大
这几天想了想越来越觉得牛逼

核心思路

  1. 基因=词组,性状=句子
  • 基因序列可以看作是一种“语言”,不同的基因(或基因组合)是词汇
  • 性状(如身高、疾病、代谢特征等)则是由这些词汇构成的“句子”或“段落”
  1. 使用滑动窗口技术(开放阅读框)将基因组序列分割为固定长度的片段(类似于 NLP 中的 token 化)

  2. 对基因序列和性状进行标准化或编码,如使用生物学上已知的重要特征

应用

  1. 基因功能预测
  • 训练成 GPT 这样的模型之后,可以用这个模型去预测已知序列,但是未知功能的片段,甚至是预测功能区
  1. 复杂性状建模
  • 多基因的相互作用是很难研究的,或许可以利用模型进行预测,类似于 GPT 中的长难句子分析
  1. 性状设计基因
  • 通过性状去设计基因

虽然刚开始这样想确实很热血,后来坐地铁路上我又想了想,至少有以下困难

  1. 数据标注
  • 生物学数据太多了,如何才能获得/标注出能用于大模型训练的数据
  1. 基因表达
  • 基因到性状的表达要先进行转录、翻译,之后形成多肽之后还要进行折叠等等过程,这个好像 Google 的 AlphaFold |Wikipedia 在做相关的工作,预测蛋白质结构
  • 基因与性状之间的关系通常是非线性的且依赖环境,如何提高模型的预测准确性是一个难题
  1. 跨物种
  • 还是和上面一样,在不同的物种之间能不能依旧很好的进行预测
  1. 预测结果的量化
  • 在我把这个想法喂给 GPT4o 之后,他给我吐出一个用于预测基因致病性的 demo,这个 demo 最后的输出结果是一个 [0, 1] 的归一化结果,虽然现在的 GPT 依然喜欢胡说八道,但是如何对结果进行评价和量化依旧是一个很好的问题

最后

这个还是 OP 一个 瞎几把 胡闹的想法,里面有很多啼笑皆非的结论或者猜想,不过我觉得这种跨学科的交流依然是很有意思的

说不定多年之后真有人给这个实现了,不出意外的话 OP 准备把这个当作某水课的课程作业交上去 :yum:

「いいね!」 2

基因组 NLP,图像 CV,应该是广泛应用了吧(

「いいね!」 1

是的,现在生物领域广泛使用了很多相关的技术和模型
比如当时做报告老师他们做野外物种个体识别就用了 YoLov5
听报告的时候我经常有一个在听 CS 报告的错觉 :thinking_face_clown_face:

朋友说低压电器年会一半人在讲 ML

「いいね!」 1

大模型预训练是自监督的方式 不需要标注

「いいね!」 1

感觉图书馆完全变成自习室了,很少能看到有同学拿书在手上看
基本上都是摆着平板和电脑,框框看网课或者写作业
去年逛图书馆的时候看到几本关于流行病学的通识书还挺有意思的 :yum:

「いいね!」 3

前段时间在兴庆图书馆看了汪曾祺的小说集《鸡鸭世家》,再次感叹汪曾祺写生活简直太厉害了。

「いいね!」 3

这周啥也没看,看书倒是看爽了

  • 美丽新世界
    自购,反乌托邦

  • 动物庄园
    自购,反乌托邦

  • 基因传
    图书馆借阅,还没来得及看完,看得头疼,读了大概五章,作者是现代遗传学之父摩尔根

  • 完美捕手
    图书馆借阅,挺有意思的一本书,类似于自传?作者作为一名流行病学家和丈夫一起对抗来自多重耐药不动杆菌的故事,最终使用噬菌体疗法获得治愈,呼吁减少抗生素使用,推广噬菌体疗法

  • 牛津通识读本:免疫系统
    自购,一般,所处地位比较尴尬,比通识难度高,比专业难度低,里面很多东西讲得云里雾里

个人对反乌托邦题材还是很喜欢的,《一九八四》高中的时候看过,给我留下了很深的影响,另外一本《我们》在路上,这几天应该就能到 :yum:

为什么期末周之前不复习看“课外书”

火烧眉毛的感觉是很好的,现在预习太早等到考试前就忘了
个人认为 sweet point 在考试前两到三天

下周还可以再看一周 :yum:

「いいね!」 5

我发现我可以帮你打钩/取消打钩:smile_cat:

「いいね!」 4

Very Short Introductions 系列买了一堆回来。中文版好像是大开本的,原版是很小的类似于日本的文库本一样的东西。可以随便揣兜里,在地铁上的时候就可以单手拿着看。

「いいね!」 2

我买的这个好像是双译的,中文在前 英文在后
书确实还有点厚实

「いいね!」 1

好有意思哈哈哈哈 似乎变成了和 Wiki 一样了

「いいね!」 1

阿门,明年的课表形状好有趣,有几门专业课好像还没置入

大学物理和近代史之前修过了应该可以免修,上一休六不是梦:smiling_face_with_three_hearts:

「いいね!」 3

想 luce 了

「いいね!」 1

今天把反乌托邦三部曲补全了,三部作品都对性爱进行了描述,但三部作品是不一样的性爱

《一九八四》是约束的性爱,以老大哥之名的性爱
《美丽新世界》是完全不受约束的性爱,你可以和任何一个感兴趣的人发生性关系,孩子甚至从小做着性启蒙游戏
《我们》中的性爱是半约束的,发生性爱要登记关系,要用卷

我其实挺好奇性爱在乌托邦社会中的地位与作用,难道仅仅是七情六欲吗,还是某种别的影射

妈的。
发现自己写项目能力好差,尤其是函数之间的耦合写的特别烂
还得练,多看看优秀的项目是怎么写的好了。

「いいね!」 1

妈的。

好尴尬,爸爸以前的同事邀请我去他在北京的家里做客,我第一次去的时候光手去的,别人都带了东西,此乃一尴尬

第二是别人姓“黄”我微信称呼他为“王”,此乃二尴尬

第三是他女儿叫我妈为姐姐,我叫他同事为伯伯,我不知道怎么称呼他夫人,是阿姨合适还是什么。

妈的。人际关系好复杂,早知道就不去了,明天还得坐将近三个小时的地铁,跨越大半个北京,回来还要坐地铁

真想烂在宿舍

「いいね!」 2

总结一下,这段关系的痛点在于:

  • 这段关系本质上是我父辈的人际关系,如果不是因为父母我可能也不会和那位伯伯一家认识
  • 我礼节处理的确实不好
  • 我有点太在乎别人对我的评价,在这段关系里我确实算我父亲的代言人,我父亲在单位也算一个有声望的人。我不想砸了他的招牌
  • 我确实不好不去,在北京读书的本身就没有几个,我也没有什么正当理由不去,何况人家还打了两个电话过来,电话打不通还特意给我发短信

我确实不适合处理人际关系。

「いいね!」 1

能看出来尴尬到了痛苦的地步,毕竟「疾痛惨怛,未尝不呼父也」。古人的智慧

不过我也很不习惯社交。在西安一共就认识两位长辈:一位是家叔高中同学(去年还来找他玩来着,当时甚至还忙里偷闲记了日记:rofl:);另一位是家严网友,因为我的某 guilt pleasure也算是有过交往。

不过进了大学,本社恐倒是狠狠地扩列了——不过起初只是一起水群,所以有些熟悉,便萌生了加个好友的想法。面基之后,对方的第一句话,往往是:「诶,你线下这么内向/腼腆啊。」:joy:哭笑不得:一方面我线下还是一如既往;另一方面至少线上有些社牛。 简直就是社交牛杂症。

不过线下活动呢,我个人觉得最好还是得去的,哪怕只是撑场子或者凑热闹。至于礼节呀什么的,如果拿不准可以问问家里人,向他们学习学习,毕竟他们深谙人情世故嘛。

主要还是 这不是我自己的人际关系 我没有充足的把握把事情安排的很好:mouse:
不过也就这样了,就厚着脸皮去
和自已的朋友相处的感觉完全不一样

「いいね!」 1