DeepGene项目项目简介DeepGene 基因语言分析计划——Deciphering the Gene Language问题是什么?自然语言的结构分析和形式语言分析的启示ChatGPT 提出了一个问题研究策略
人类基因序列(DNA/RNA、蛋白质序列)具有怎么样的结构?
什么是基因的结构?
进化是序列结构从简单到复杂的驱动力
他们在研究上是否可以互为参照?
我们希望AI给人类提供一个可解释、可理解的基因结构吗?
还是我们只需要AI自己理解,帮助我们解决疾病、衰老等问题就好?
收集语料(不同人、人种、物种的DNA/RNA/蛋白质序列)
收集Ground Truth(已知序列结构、功能的Database)
学习遗传学知识(中心法则、基因调控...)、生物信息学知识(Kmer...)
阅读AI+Gene的文献
选择2-3个简单、预料丰富的任务进行先期研究