daily.zhihu.com

人类基因是一套屎山代码吗? (opens in new tab)

Dunkirk,勇气与真意 查看知乎原文 人类基因组大约有 30 亿个碱基对,但真正用来编码蛋白质的部分只占不到 2%。剩下将近 98%,里面堆满了各种东西:失去功能的假基因,曾经能用,后来突变坏掉了,但就这么留着没被清除;转座子的残骸,一种会自我复制、到处乱插入的寄生序列,光这一类就占了将近一半的基因组;还有数不清的重复片段,有些短序列在基因组里重复出现几十万次,没有人知道为什么。 很长一段时间里,这些东西被统称为垃圾 DNA。这非常像一个几十年的老项目,里面全是注释掉的函数、废弃的模块、没人敢动的死代码,因为没有人确定它们是不是真的没用。 然后是内含子。一个基因在被转录成 RNA 之后,里面大量的片段需要先被剪掉,剩下的部分拼接在一起,才能用来合成蛋白质。被剪掉的叫内含子,留下来的叫外显子。人类基因里内含子的比例远大于外显子,有些基因超过 95%都是内含子。整个过程相当于写了一万行代码,运行之前要先自动删掉九千行,再把剩下的拼起来才能执行。更麻烦的是同一个基因还可以通过不同的剪接方式产生结构和功能都不同的蛋白质,这叫可变剪接。人类基因数量大约只有两万个,但蛋白质种类远不止这个...

Read the original article
Sign in to keep reading the full article.

Keyboard Shortcuts

Navigation

Next / previous post
j/k
Open post
oorEnter
Preview post
v

Post Actions

Love post
a
Like post
l
Dislike post
d
Undo reaction
u
Save / unsave
s

Recommendations

Add interest / feed
Enter
Not interested
x

Go to

Home
gh
Interests
gi
Feeds
gf
Likes
gl
History
gy
Changelog
gc
Settings
gs
Discover
gb
Search
/

General

Show this help
?
Submit feedback
!
Close modal / unfocus
Esc

Press ? anytime to show this help