Розшифрували Геном людини сімнадцять років тому, але ми досі не знаємо, скільки в ньому генів. Згідно з новим дослідженням, їх удвічі більше, ніж вважалося.
Повний список генів, що складають людську ДНК, був би одним з найбільш корисних інструментів в руках вчених, в першу чергу біологів і медиків. Але незважаючи на те що проект «Геном людини» завершили 17 років тому, у вчених до цих пір немає єдиної думки навіть про кількість генів, не кажучи вже про єдиний вичерпний список. Чергову спробу оцінити кількість генів і каталогізувати їх зробила група американських біологів, і новий результат в півтора-два рази перевершив попередні оцінки.
У 1990 році, коли стартував проект «Геном людини» (HGP), передбачалося, що в людській ДНК міститься близько 100 тисяч генів (на початку дев’яностих під геномом малася на увазі ділянка ДНК, що несе інформацію про структуру білка). У 2001-му були опубліковані результати HGP та аналогічного проекту Крейга Вентера і його компанії Celera Corporation; у першій статті йшлося про 31 тисячу, у другій — про 26 588 гени, що кодують білки. В наступній статті HGP говорилося вже про 24 тисячі генів. База даних, створена учасниками проекту Ensembl, у найактуальнішої версії (34d) містить інформацію про 22 298 кодуючих білки генів і їх 34 214 транскриптах.
Поповненням і редагуванням списку генів людини займаються лише дві організації: вже згаданий проект Європейського інституту біоінформатики та Інституту Сенгера Ensembl/Gencode і Національний центр біотехнологічної інформації США, веде базу даних RefSeq. Між цими каталогами існують сотні розбіжностей і в тому, що стосується генів кодуючих білки, і в описі довгих некодуючих РНК; є різниця і в типології генів. Крім того, обидва каталоги постійно оновлюються: тільки за минулий рік в Gencode внесли і видалили з нього кілька сотень генів.
Поява у 2008 році технології секвенування РНК змусило біологів переглянути визначення гена: зараз багато фахівців схильні вважати геном і послідовність нуклеотидів, яка кодує РНК, на якій не синтезується білок, але яка сама бере участь у метаболізмі. З урахуванням таких послідовностей число генів у геномі людини може бути значно більше, ніж двадцять і навіть тридцять тисяч.
У 2017 році група дослідників під керівництвом Стівена Зальцберга (Steven Salzberg), спеціаліста по статистичних методах у біології в Інституті Джонса Хопкінса, почала роботу над новим каталогом людських генів. Для цього вчені обробили результати майже 10 тисяч експериментів по секвенуванню РНК із зразків 31 виду тканин людського тіла. У новій базі даних виявилося 43 162 гена, з яких 21 306 кодують білки, а 21 тисяча — ні. До каталогу увійшли майже п’ять тисяч нових генів і 30 мільйонів нових варіантів транскриптів, велика частина з яких, на думку авторів роботи, не бере участі ні в яких процесах життєдіяльності; процес читання ДНК у клітині виявився дуже «гучним». Препринт статті з цими результатами викладений в репозиторії bioRxiv; у кінці серпня Зальцберг опублікував в BMC Biology статтю, в якій розповів про роботу.
Група Зальцберга не вважає свої результати остаточними; нещодавно каталог отримав перше оновлення і їх передбачається ще багато. «Я не здивуюся, якщо і через десять років ми не прийдемо до консенсусу про кількість генів у людському ДНК», — зазначає Зальцберг. Але, незважаючи на це, учений вважає, що нова база даних буде корисна: зокрема, для пошуку генів, відповідальних за розвиток спадкових захворювань, причини яких встановити досі не вдалося.