В генно-инженерных работах часто используются эндонуклеазы рестрикции (рестриктазы). Это ферменты, которые узнают определённые последовательности нуклеотидов и в этих местах расщепляют молекулу ДНК
на части.
Сколько раз встретится сайт узнавания эндонуклеазы рестрикции GGATCC в последовательности, состоящей из 10000 нуклеотидов?
1 Ответ
Так как каждый участок длиной GGATCC будет встречаться дважды (с начала и с конца последовательности), то искомое количество будет в два раза больше действительного.
Последовательность состоит из 10 000 нуклеотидов, значит, всего есть 5000 “пар” нуклеотидов.
Если предположить, что каждый из 5000 пар нуклеотидов является случайным, вероятность встретить в нем специфическую последовательность GGATCC составит 1/4^4 (один успех на четыре испытания, так как у нас 4 нуклеотида в GGATCC).
Тогда по закону редких событий (4/16 или 1/4 значительно меньше единицы), мы можем использовать приближение Пуассона для вычисления вероятности.
Вероятность встретить GGATCC хотя бы один раз будет равна 1 — e^(-1/4 * 5000) = 1 — 1/e^125 ≈ 0.9999
Значит, искомое количество сайтов GGATCC приблизительно равно 2 * 0.9999 ≈ 2.