最近有一个实验设计,然后是和另外一个做湿实验的小组一起做的,然后我的工作就是用类似 Diffusion Model 去对蛋白进行改造,然后看看如何改造蛋白可以获得一个可能性能更好的蛋白,然后预测出 10-20 条序列,交给做湿实验的同学去表达,验证,但是我一直觉得这东西很玄乎,因为预测永远只是预测,有可能你电脑里面跑得好好的,然后一表达就出问题
然后导师说继续做一下,如果不行就换个方向
最近有一个实验设计,然后是和另外一个做湿实验的小组一起做的,然后我的工作就是用类似 Diffusion Model 去对蛋白进行改造,然后看看如何改造蛋白可以获得一个可能性能更好的蛋白,然后预测出 10-20 条序列,交给做湿实验的同学去表达,验证,但是我一直觉得这东西很玄乎,因为预测永远只是预测,有可能你电脑里面跑得好好的,然后一表达就出问题
然后导师说继续做一下,如果不行就换个方向
Bio x AI 现在应该挺常见的。
远的不说,现在导师组里就有师兄在用生成模型在做细胞演化和基因表达预测任务,化学那边(我高中同学在 pku 化院)还有用生成式模型做小分子/大分子生成和性质预测的。。。我其实也有点不信这个,之前和高中同学交流,他说其实化学和生物那边很多机理人类还不是太清楚,或许大数据量加持下的 AI 确实能力大砖飞解决问题?而且,更现实的层面,AI4S 应当算是 AI 顶会里相对来说好发文章的方向
像是多模态生成、视频生成之类的,还是太吃组里资源、算力和操作了 ![]()
个人观点是,现在生成式模型在生物/化学中的应用应该还在起步阶段,或许 5-10 年之后,确实会技术爆发。就跟 Transformer 出世 5 年之后爆发出 LLM 潮一样。
我现在手头上就还有一个挺有意思的课题,做的是单细胞来预测下游通路的,用的就是类似 Transformer,不过我们把几个层魔改了一下
Transformer 对于生物学这种长上下文的场景其实非常合适,最新的 AlphaFold3 就是魔改了 Transformer 好像(似乎 af2 就已经开始魔改加注意力了,Evoformer)
不过我一直觉得生物学和计算机学界一直是脱节的,属于那种计算机界都已经老掉牙的东西,学生物的才捡起来。。。
嗯,组里师兄之前的文章就是 single cell 的,好像这一块有不少用 flow matching 在做的
抛开学术界的东西不谈
我觉得假如能搞出个特别牛逼的拿来搞瑟瑟的 nsfw 大模型,应该可以搞很多钱钱
把 admin 的审核大模型取一个反向量
我的一个非 CS 专业高中同学就在本地部署了 stable diffusion 用来跑瑟图 ![]()
瑟瑟是第一生产力! ![]()
我第一次接触 Stable Diffusion 也是为了画瑟瑟,23 年吧
那时候还买不到显卡,当时专门买了张计算卡 P4 来画图
接触了 LoRA 和微调之类的东西
当时效果不太好
脑电 脑机接口那块也差不多,两年前在脑信号处理用 transformer 的 paper 就很先进了,现在倒是有在弄脑电大模型这种说法
前几天还在和师兄聊
以后假如都接入脑机系统,然后给你装个反诈中心
那就真的是「big brother is watching you」
侵入式现在都没法准确读取信息吧,感觉写入更不现实 ![]()