-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathintro.html
2397 lines (2347 loc) · 241 KB
/
intro.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
<!DOCTYPE html>
<html lang="" xml:lang="">
<head>
<meta charset="utf-8" />
<meta http-equiv="X-UA-Compatible" content="IE=edge" />
<title>Capítulo 1 Introducción a la Genómica | Introducción a la Genética de Poblaciones y a la Genética Cuantitativa</title>
<meta name="description" content="Apuntes del curso Genética II. Contenido teórico mínimo para el seguimiento del curso" />
<meta name="generator" content="bookdown 0.37 and GitBook 2.6.7" />
<meta property="og:title" content="Capítulo 1 Introducción a la Genómica | Introducción a la Genética de Poblaciones y a la Genética Cuantitativa" />
<meta property="og:type" content="book" />
<meta property="og:description" content="Apuntes del curso Genética II. Contenido teórico mínimo para el seguimiento del curso" />
<meta name="github-repo" content="rstudio/bookdown-demo" />
<meta name="twitter:card" content="summary" />
<meta name="twitter:title" content="Capítulo 1 Introducción a la Genómica | Introducción a la Genética de Poblaciones y a la Genética Cuantitativa" />
<meta name="twitter:description" content="Apuntes del curso Genética II. Contenido teórico mínimo para el seguimiento del curso" />
<meta name="author" content="Hugo Naya" />
<meta name="author" content="Federica Marín" />
<meta name="author" content="Mauricio Langleib" />
<meta name="author" content="(Graciana Castro)" />
<meta name="date" content="2024-04-11" />
<meta name="viewport" content="width=device-width, initial-scale=1" />
<meta name="apple-mobile-web-app-capable" content="yes" />
<meta name="apple-mobile-web-app-status-bar-style" content="black" />
<link rel="prev" href="index.html"/>
<link rel="next" href="variacion.html"/>
<script src="libs/jquery-3.6.0/jquery-3.6.0.min.js"></script>
<script src="https://cdn.jsdelivr.net/npm/fuse.js@6.4.6/dist/fuse.min.js"></script>
<link href="libs/gitbook-2.6.7/css/style.css" rel="stylesheet" />
<link href="libs/gitbook-2.6.7/css/plugin-table.css" rel="stylesheet" />
<link href="libs/gitbook-2.6.7/css/plugin-bookdown.css" rel="stylesheet" />
<link href="libs/gitbook-2.6.7/css/plugin-highlight.css" rel="stylesheet" />
<link href="libs/gitbook-2.6.7/css/plugin-search.css" rel="stylesheet" />
<link href="libs/gitbook-2.6.7/css/plugin-fontsettings.css" rel="stylesheet" />
<link href="libs/gitbook-2.6.7/css/plugin-clipboard.css" rel="stylesheet" />
<link href="libs/anchor-sections-1.1.0/anchor-sections.css" rel="stylesheet" />
<link href="libs/anchor-sections-1.1.0/anchor-sections-hash.css" rel="stylesheet" />
<script src="libs/anchor-sections-1.1.0/anchor-sections.js"></script>
<script src="libs/kePrint-0.0.1/kePrint.js"></script>
<link href="libs/lightable-0.0.1/lightable.css" rel="stylesheet" />
<link href="libs/bsTable-3.3.7/bootstrapTable.min.css" rel="stylesheet" />
<script src="libs/bsTable-3.3.7/bootstrapTable.js"></script>
<style type="text/css">
pre > code.sourceCode { white-space: pre; position: relative; }
pre > code.sourceCode > span { line-height: 1.25; }
pre > code.sourceCode > span:empty { height: 1.2em; }
.sourceCode { overflow: visible; }
code.sourceCode > span { color: inherit; text-decoration: inherit; }
pre.sourceCode { margin: 0; }
@media screen {
div.sourceCode { overflow: auto; }
}
@media print {
pre > code.sourceCode { white-space: pre-wrap; }
pre > code.sourceCode > span { text-indent: -5em; padding-left: 5em; }
}
pre.numberSource code
{ counter-reset: source-line 0; }
pre.numberSource code > span
{ position: relative; left: -4em; counter-increment: source-line; }
pre.numberSource code > span > a:first-child::before
{ content: counter(source-line);
position: relative; left: -1em; text-align: right; vertical-align: baseline;
border: none; display: inline-block;
-webkit-touch-callout: none; -webkit-user-select: none;
-khtml-user-select: none; -moz-user-select: none;
-ms-user-select: none; user-select: none;
padding: 0 4px; width: 4em;
color: #aaaaaa;
}
pre.numberSource { margin-left: 3em; border-left: 1px solid #aaaaaa; padding-left: 4px; }
div.sourceCode
{ }
@media screen {
pre > code.sourceCode > span > a:first-child::before { text-decoration: underline; }
}
code span.al { color: #ff0000; font-weight: bold; } /* Alert */
code span.an { color: #60a0b0; font-weight: bold; font-style: italic; } /* Annotation */
code span.at { color: #7d9029; } /* Attribute */
code span.bn { color: #40a070; } /* BaseN */
code span.bu { color: #008000; } /* BuiltIn */
code span.cf { color: #007020; font-weight: bold; } /* ControlFlow */
code span.ch { color: #4070a0; } /* Char */
code span.cn { color: #880000; } /* Constant */
code span.co { color: #60a0b0; font-style: italic; } /* Comment */
code span.cv { color: #60a0b0; font-weight: bold; font-style: italic; } /* CommentVar */
code span.do { color: #ba2121; font-style: italic; } /* Documentation */
code span.dt { color: #902000; } /* DataType */
code span.dv { color: #40a070; } /* DecVal */
code span.er { color: #ff0000; font-weight: bold; } /* Error */
code span.ex { } /* Extension */
code span.fl { color: #40a070; } /* Float */
code span.fu { color: #06287e; } /* Function */
code span.im { color: #008000; font-weight: bold; } /* Import */
code span.in { color: #60a0b0; font-weight: bold; font-style: italic; } /* Information */
code span.kw { color: #007020; font-weight: bold; } /* Keyword */
code span.op { color: #666666; } /* Operator */
code span.ot { color: #007020; } /* Other */
code span.pp { color: #bc7a00; } /* Preprocessor */
code span.sc { color: #4070a0; } /* SpecialChar */
code span.ss { color: #bb6688; } /* SpecialString */
code span.st { color: #4070a0; } /* String */
code span.va { color: #19177c; } /* Variable */
code span.vs { color: #4070a0; } /* VerbatimString */
code span.wa { color: #60a0b0; font-weight: bold; font-style: italic; } /* Warning */
</style>
<style type="text/css">
div.hanging-indent{margin-left: 1.5em; text-indent: -1.5em;}
</style>
<style type="text/css">
/* Used with Pandoc 2.11+ new --citeproc when CSL is used */
div.csl-bib-body { }
div.csl-entry {
clear: both;
margin-bottom: 0em;
}
.hanging div.csl-entry {
margin-left:2em;
text-indent:-2em;
}
div.csl-left-margin {
min-width:2em;
float:left;
}
div.csl-right-inline {
margin-left:2em;
padding-left:1em;
}
div.csl-indent {
margin-left: 2em;
}
</style>
<link rel="stylesheet" href="style.css" type="text/css" />
</head>
<body>
<div class="book without-animation with-summary font-size-2 font-family-1" data-basepath=".">
<div class="book-summary">
<nav role="navigation">
<ul class="summary">
<li><a href="./">Genética II</a></li>
<li class="divider"></li>
<li class="chapter" data-level="" data-path="index.html"><a href="index.html"><i class="fa fa-check"></i>Prefacio</a>
<ul>
<li class="chapter" data-level="" data-path="index.html"><a href="index.html#nuestra-filosofía-del-no-tanto"><i class="fa fa-check"></i>Nuestra filosofía del NO (tanto)</a></li>
<li class="chapter" data-level="" data-path="index.html"><a href="index.html#qué-es-y-qué-no-es-este-libro"><i class="fa fa-check"></i>¿Qué ES y qué NO ES este libro?</a></li>
<li class="chapter" data-level="" data-path="index.html"><a href="index.html#bibliografía-recomendada-para-este-curso"><i class="fa fa-check"></i>Bibliografía recomendada para este curso</a></li>
<li class="chapter" data-level="" data-path="index.html"><a href="index.html#responsabilidades-y-agradecimientos"><i class="fa fa-check"></i>Responsabilidades y Agradecimientos</a></li>
<li class="chapter" data-level="" data-path="index.html"><a href="index.html#íconos-utilizados-en-este-libro"><i class="fa fa-check"></i>Íconos utilizados en este libro</a></li>
</ul></li>
<li class="part"><span><b>Parte I: Genómica</b></span></li>
<li class="chapter" data-level="1" data-path="intro.html"><a href="intro.html"><i class="fa fa-check"></i><b>1</b> Introducción a la Genómica</a>
<ul>
<li class="chapter" data-level="1.1" data-path="intro.html"><a href="intro.html#variabilidad-genética"><i class="fa fa-check"></i><b>1.1</b> Variabilidad genética</a></li>
<li class="chapter" data-level="1.2" data-path="intro.html"><a href="intro.html#genómica-composicional"><i class="fa fa-check"></i><b>1.2</b> Genómica composicional</a></li>
<li class="chapter" data-level="1.3" data-path="intro.html"><a href="intro.html#genómica-comparativa"><i class="fa fa-check"></i><b>1.3</b> Genómica comparativa</a></li>
<li class="chapter" data-level="1.4" data-path="intro.html"><a href="intro.html#genómica-funcional"><i class="fa fa-check"></i><b>1.4</b> Genómica funcional</a></li>
<li class="chapter" data-level="1.5" data-path="intro.html"><a href="intro.html#conclusión"><i class="fa fa-check"></i><b>1.5</b> Conclusión</a></li>
<li class="chapter" data-level="1.6" data-path="intro.html"><a href="intro.html#actividades"><i class="fa fa-check"></i><b>1.6</b> Actividades</a></li>
</ul></li>
<li class="part"><span><b>Parte II: Genética de Poblaciones</b></span></li>
<li class="chapter" data-level="2" data-path="variacion.html"><a href="variacion.html"><i class="fa fa-check"></i><b>2</b> Variación y equilibrio de Hardy-Weinberg</a>
<ul>
<li class="chapter" data-level="2.1" data-path="variacion.html"><a href="variacion.html#el-equilibrio-de-hardy-weinberg"><i class="fa fa-check"></i><b>2.1</b> El equilibrio de Hardy-Weinberg</a></li>
<li class="chapter" data-level="2.2" data-path="variacion.html"><a href="variacion.html#hardy-weinberg-en-especies-dioicas-dos-sexos"><i class="fa fa-check"></i><b>2.2</b> Hardy-Weinberg en especies dioicas (dos sexos)</a></li>
<li class="chapter" data-level="2.3" data-path="variacion.html"><a href="variacion.html#heterocigotas-freq-alelica"><i class="fa fa-check"></i><b>2.3</b> H-W: la frecuencia de heterocigotas en función de la frecuencia alélica</a></li>
<li class="chapter" data-level="2.4" data-path="variacion.html"><a href="variacion.html#el-equilibrio-de-hardy-weinberg-en-cromosomas-ligados-al-sexo"><i class="fa fa-check"></i><b>2.4</b> El equilibrio de Hardy-Weinberg en cromosomas ligados al sexo</a></li>
<li class="chapter" data-level="2.5" data-path="variacion.html"><a href="variacion.html#tres-o-más-alelos"><i class="fa fa-check"></i><b>2.5</b> Tres o más alelos</a></li>
<li class="chapter" data-level="2.6" data-path="variacion.html"><a href="variacion.html#la-estimación-de-frecuencias-y-el-equilibrio-o-no"><i class="fa fa-check"></i><b>2.6</b> La estimación de frecuencias y el equilibrio (o no)</a></li>
<li class="chapter" data-level="2.7" data-path="variacion.html"><a href="variacion.html#el-sistema-abo"><i class="fa fa-check"></i><b>2.7</b> El sistema ABO</a></li>
<li class="chapter" data-level="2.8" data-path="variacion.html"><a href="variacion.html#dónde-se-esconden-los-alelos-recesivos"><i class="fa fa-check"></i><b>2.8</b> ¿Dónde se “esconden” los alelos recesivos?</a></li>
<li class="chapter" data-level="2.9" data-path="variacion.html"><a href="variacion.html#hardy-weinberg-en-especies-poliploides"><i class="fa fa-check"></i><b>2.9</b> Hardy-Weinberg en especies poliploides</a></li>
<li class="chapter" data-level="2.10" data-path="variacion.html"><a href="variacion.html#geometría-y-genética-los-diagramas-de-de-finetti"><i class="fa fa-check"></i><b>2.10</b> Geometría y Genética: los diagramas de <em>de Finetti</em></a></li>
<li class="chapter" data-level="2.11" data-path="variacion.html"><a href="variacion.html#estimacion-abo"><i class="fa fa-check"></i><b>2.11</b> La estimación de frecuencias en el locus ABO</a></li>
<li class="chapter" data-level="2.12" data-path="variacion.html"><a href="variacion.html#conclusión-1"><i class="fa fa-check"></i><b>2.12</b> Conclusión</a></li>
<li class="chapter" data-level="2.13" data-path="variacion.html"><a href="variacion.html#actividades-1"><i class="fa fa-check"></i><b>2.13</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="3" data-path="deriva.html"><a href="deriva.html"><i class="fa fa-check"></i><b>3</b> Deriva genética</a>
<ul>
<li class="chapter" data-level="3.1" data-path="deriva.html"><a href="deriva.html#el-rol-de-los-procesos-estocásticos-en-la-genética"><i class="fa fa-check"></i><b>3.1</b> El rol de los procesos estocásticos en la genética</a></li>
<li class="chapter" data-level="3.2" data-path="deriva.html"><a href="deriva.html#el-modelo-de-wright-fisher"><i class="fa fa-check"></i><b>3.2</b> El modelo de Wright-Fisher</a></li>
<li class="chapter" data-level="3.3" data-path="deriva.html"><a href="deriva.html#la-subdivisión-poblacional-y-la-evolución-de-las-frecuencias-alélicas"><i class="fa fa-check"></i><b>3.3</b> La subdivisión poblacional y la evolución de las frecuencias alélicas</a></li>
<li class="chapter" data-level="3.4" data-path="deriva.html"><a href="deriva.html#cadenas-de-markov"><i class="fa fa-check"></i><b>3.4</b> Cadenas de Markov</a></li>
<li class="chapter" data-level="3.5" data-path="deriva.html"><a href="deriva.html#tamaño-efectivo-poblacional"><i class="fa fa-check"></i><b>3.5</b> Tamaño efectivo poblacional</a></li>
<li class="chapter" data-level="3.6" data-path="deriva.html"><a href="deriva.html#aproximación-de-difusión"><i class="fa fa-check"></i><b>3.6</b> Aproximación de difusión</a></li>
<li class="chapter" data-level="3.7" data-path="deriva.html"><a href="deriva.html#probabilidad-de-fijación-y-tiempos-de-fijación"><i class="fa fa-check"></i><b>3.7</b> Probabilidad de fijación y tiempos de fijación</a></li>
<li class="chapter" data-level="3.8" data-path="deriva.html"><a href="deriva.html#el-modelo-coalescente"><i class="fa fa-check"></i><b>3.8</b> El modelo coalescente</a></li>
<li class="chapter" data-level="3.9" data-path="deriva.html"><a href="deriva.html#conclusión-2"><i class="fa fa-check"></i><b>3.9</b> Conclusión</a></li>
<li class="chapter" data-level="3.10" data-path="deriva.html"><a href="deriva.html#actividades-2"><i class="fa fa-check"></i><b>3.10</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="4" data-path="seleccion.html"><a href="seleccion.html"><i class="fa fa-check"></i><b>4</b> Selección natural</a>
<ul>
<li class="chapter" data-level="4.1" data-path="seleccion.html"><a href="seleccion.html#el-concepto-de-fitness"><i class="fa fa-check"></i><b>4.1</b> El concepto de “<em>fitness</em>”</a></li>
<li class="chapter" data-level="4.2" data-path="seleccion.html"><a href="seleccion.html#selección-natural-en-el-modelo-de-un-locus-con-dos-alelos"><i class="fa fa-check"></i><b>4.2</b> Selección natural en el modelo de un locus con dos alelos</a></li>
<li class="chapter" data-level="4.3" data-path="seleccion.html"><a href="seleccion.html#diferentes-formas-de-selección"><i class="fa fa-check"></i><b>4.3</b> Diferentes formas de selección</a></li>
<li class="chapter" data-level="4.4" data-path="seleccion.html"><a href="seleccion.html#el-teorema-fundamental-de-la-selección-natural"><i class="fa fa-check"></i><b>4.4</b> El teorema fundamental de la selección natural</a></li>
<li class="chapter" data-level="4.5" data-path="seleccion.html"><a href="seleccion.html#equilibrio-selección-mutación"><i class="fa fa-check"></i><b>4.5</b> Equilibrio selección-mutación</a></li>
<li class="chapter" data-level="4.6" data-path="seleccion.html"><a href="seleccion.html#la-fuerza-de-la-selección-natural"><i class="fa fa-check"></i><b>4.6</b> La fuerza de la selección natural</a></li>
<li class="chapter" data-level="4.7" data-path="seleccion.html"><a href="seleccion.html#equilibrio-selección-deriva"><i class="fa fa-check"></i><b>4.7</b> Equilibrio selección-deriva</a></li>
<li class="chapter" data-level="4.8" data-path="seleccion.html"><a href="seleccion.html#otros-tipos-de-selección-y-complejidades"><i class="fa fa-check"></i><b>4.8</b> Otros tipos de selección y complejidades</a></li>
<li class="chapter" data-level="4.9" data-path="seleccion.html"><a href="seleccion.html#conclusión-3"><i class="fa fa-check"></i><b>4.9</b> Conclusión</a></li>
<li class="chapter" data-level="4.10" data-path="seleccion.html"><a href="seleccion.html#actividades-3"><i class="fa fa-check"></i><b>4.10</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="5" data-path="dosloci.html"><a href="dosloci.html"><i class="fa fa-check"></i><b>5</b> Dinámica de 2 <em>loci</em></a>
<ul>
<li class="chapter" data-level="5.1" data-path="dosloci.html"><a href="dosloci.html#desequilibrio-de-ligamiento-y-recombinación"><i class="fa fa-check"></i><b>5.1</b> Desequilibrio de ligamiento y recombinación</a></li>
<li class="chapter" data-level="5.2" data-path="dosloci.html"><a href="dosloci.html#la-evolución-en-el-tiempo-del-desequilibrio-de-ligamiento"><i class="fa fa-check"></i><b>5.2</b> La evolución en el tiempo del desequilibrio de ligamiento</a></li>
<li class="chapter" data-level="5.3" data-path="dosloci.html"><a href="dosloci.html#otras-medidas-de-asociación"><i class="fa fa-check"></i><b>5.3</b> Otras medidas de asociación</a></li>
<li class="chapter" data-level="5.4" data-path="dosloci.html"><a href="dosloci.html#selección-en-modelos-de-dos-loci"><i class="fa fa-check"></i><b>5.4</b> Selección en modelos de dos <em>loci</em></a></li>
<li class="chapter" data-level="5.5" data-path="dosloci.html"><a href="dosloci.html#arrastre-genético-genetic-hitchhiking-o-genetic-draft"><i class="fa fa-check"></i><b>5.5</b> Arrastre genético (“<em>genetic hitchhiking</em>” o “<em>genetic draft</em>”)</a></li>
<li class="chapter" data-level="5.6" data-path="dosloci.html"><a href="dosloci.html#causas-del-desequilibrio-de-ligamiento"><i class="fa fa-check"></i><b>5.6</b> Causas del desequilibrio de ligamiento</a></li>
<li class="chapter" data-level="5.7" data-path="dosloci.html"><a href="dosloci.html#conclusión-4"><i class="fa fa-check"></i><b>5.7</b> Conclusión</a></li>
<li class="chapter" data-level="5.8" data-path="dosloci.html"><a href="dosloci.html#actividades-4"><i class="fa fa-check"></i><b>5.8</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="6" data-path="aparnoalazar.html"><a href="aparnoalazar.html"><i class="fa fa-check"></i><b>6</b> Apareamientos no-aleatorios</a>
<ul>
<li class="chapter" data-level="6.1" data-path="aparnoalazar.html"><a href="aparnoalazar.html#el-concepto-de-identidad-por-ascendencia-ibd"><i class="fa fa-check"></i><b>6.1</b> El concepto de “identidad por ascendencia” (IBD)</a></li>
<li class="chapter" data-level="6.2" data-path="aparnoalazar.html"><a href="aparnoalazar.html#generalización-de-hardy-weinberg-para-apareamientos-no-aleatorios"><i class="fa fa-check"></i><b>6.2</b> Generalización de Hardy-Weinberg para apareamientos no-aleatorios</a></li>
<li class="chapter" data-level="6.3" data-path="aparnoalazar.html"><a href="aparnoalazar.html#f-como-correlación-entre-gametos-unidos"><i class="fa fa-check"></i><b>6.3</b> <span class="math inline">\(F\)</span> como correlación entre gametos unidos</a></li>
<li class="chapter" data-level="6.4" data-path="aparnoalazar.html"><a href="aparnoalazar.html#endocría-y-depresión-endogámica"><i class="fa fa-check"></i><b>6.4</b> Endocría y depresión endogámica</a></li>
<li class="chapter" data-level="6.5" data-path="aparnoalazar.html"><a href="aparnoalazar.html#un-caso-extremo-la-autogamia"><i class="fa fa-check"></i><b>6.5</b> Un caso extremo: la autogamia</a></li>
<li class="chapter" data-level="6.6" data-path="aparnoalazar.html"><a href="aparnoalazar.html#el-coeficiente-de-endocría-y-los-estadísticos-f"><i class="fa fa-check"></i><b>6.6</b> El coeficiente de endocría y los estadísticos <em>F</em></a></li>
<li class="chapter" data-level="6.7" data-path="aparnoalazar.html"><a href="aparnoalazar.html#el-efecto-wahlund"><i class="fa fa-check"></i><b>6.7</b> El efecto Wahlund</a></li>
<li class="chapter" data-level="6.8" data-path="aparnoalazar.html"><a href="aparnoalazar.html#subdivisión-migración-y-el-modelo-de-islas"><i class="fa fa-check"></i><b>6.8</b> Subdivisión, migración y el modelo de islas</a></li>
<li class="chapter" data-level="6.9" data-path="aparnoalazar.html"><a href="aparnoalazar.html#mecanismos-de-especiación"><i class="fa fa-check"></i><b>6.9</b> Mecanismos de especiación</a></li>
<li class="chapter" data-level="6.10" data-path="aparnoalazar.html"><a href="aparnoalazar.html#conclusión-5"><i class="fa fa-check"></i><b>6.10</b> Conclusión</a></li>
<li class="chapter" data-level="6.11" data-path="aparnoalazar.html"><a href="aparnoalazar.html#actividades-5"><i class="fa fa-check"></i><b>6.11</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="7" data-path="microbial.html"><a href="microbial.html"><i class="fa fa-check"></i><b>7</b> Genética de poblaciones microbianas</a>
<ul>
<li class="chapter" data-level="7.1" data-path="microbial.html"><a href="microbial.html#genómica-y-mecanismos-de-herencia-en-procariotas"><i class="fa fa-check"></i><b>7.1</b> Genómica y mecanismos de herencia en procariotas</a></li>
<li class="chapter" data-level="7.2" data-path="microbial.html"><a href="microbial.html#dinámica-de-las-poblaciones-bacterianas"><i class="fa fa-check"></i><b>7.2</b> Dinámica de las poblaciones bacterianas</a></li>
<li class="chapter" data-level="7.3" data-path="microbial.html"><a href="microbial.html#modelos-haploides-de-selección-natural"><i class="fa fa-check"></i><b>7.3</b> Modelos haploides de selección natural</a></li>
<li class="chapter" data-level="7.4" data-path="microbial.html"><a href="microbial.html#los-modelos-de-moran-y-de-fisión-vs-el-de-wright-fisher"><i class="fa fa-check"></i><b>7.4</b> Los modelos de Moran y de fisión <em>vs</em> el de Wright-Fisher</a></li>
<li class="chapter" data-level="7.5" data-path="microbial.html"><a href="microbial.html#el-rol-de-la-transferencia-horizontal"><i class="fa fa-check"></i><b>7.5</b> El rol de la transferencia horizontal</a></li>
<li class="chapter" data-level="7.6" data-path="microbial.html"><a href="microbial.html#seleccionismo-vs-neutralismo-los-procariotas-en-el-debate"><i class="fa fa-check"></i><b>7.6</b> Seleccionismo <em>vs</em> neutralismo: los procariotas en el debate</a></li>
<li class="chapter" data-level="7.7" data-path="microbial.html"><a href="microbial.html#genómica-poblacional"><i class="fa fa-check"></i><b>7.7</b> Genómica poblacional</a></li>
<li class="chapter" data-level="7.8" data-path="microbial.html"><a href="microbial.html#genes-de-resistencia"><i class="fa fa-check"></i><b>7.8</b> Genes de resistencia</a></li>
<li class="chapter" data-level="7.9" data-path="microbial.html"><a href="microbial.html#introducción-a-la-epidemiología-modelos-compartimentales"><i class="fa fa-check"></i><b>7.9</b> Introducción a la epidemiología: modelos compartimentales</a></li>
<li class="chapter" data-level="7.10" data-path="microbial.html"><a href="microbial.html#conclusión-6"><i class="fa fa-check"></i><b>7.10</b> Conclusión</a></li>
<li class="chapter" data-level="7.11" data-path="microbial.html"><a href="microbial.html#actividades-6"><i class="fa fa-check"></i><b>7.11</b> Actividades</a></li>
</ul></li>
<li class="part"><span><b>Parte III: Genética Cuantitativa</b></span></li>
<li class="chapter" data-level="8" data-path="modelogenbas.html"><a href="modelogenbas.html"><i class="fa fa-check"></i><b>8</b> El modelo genético básico</a>
<ul>
<li class="chapter" data-level="8.1" data-path="modelogenbas.html"><a href="modelogenbas.html#variación-continua-y-discreta"><i class="fa fa-check"></i><b>8.1</b> Variación continua y discreta</a></li>
<li class="chapter" data-level="8.2" data-path="modelogenbas.html"><a href="modelogenbas.html#el-modelo-genético-básico"><i class="fa fa-check"></i><b>8.2</b> El modelo genético básico</a></li>
<li class="chapter" data-level="8.3" data-path="modelogenbas.html"><a href="modelogenbas.html#modelo-genético-básico-un-locus-con-dos-alelos"><i class="fa fa-check"></i><b>8.3</b> Modelo genético básico: un <em>locus</em> con dos alelos</a></li>
<li class="chapter" data-level="8.4" data-path="modelogenbas.html"><a href="modelogenbas.html#efecto-medio"><i class="fa fa-check"></i><b>8.4</b> Efecto medio</a></li>
<li class="chapter" data-level="8.5" data-path="modelogenbas.html"><a href="modelogenbas.html#valor-reproductivo-o-valor-de-cría"><i class="fa fa-check"></i><b>8.5</b> Valor reproductivo (o valor de cría)</a></li>
<li class="chapter" data-level="8.6" data-path="modelogenbas.html"><a href="modelogenbas.html#desvío-de-dominancia"><i class="fa fa-check"></i><b>8.6</b> Desvío de dominancia</a></li>
<li class="chapter" data-level="8.7" data-path="modelogenbas.html"><a href="modelogenbas.html#interacción-genotipo-x-ambiente"><i class="fa fa-check"></i><b>8.7</b> Interacción Genotipo x Ambiente</a></li>
<li class="chapter" data-level="8.8" data-path="modelogenbas.html"><a href="modelogenbas.html#la-varianza-en-el-modelo-genético-básico"><i class="fa fa-check"></i><b>8.8</b> La varianza en el modelo genético básico</a></li>
<li class="chapter" data-level="8.9" data-path="modelogenbas.html"><a href="modelogenbas.html#conclusión-7"><i class="fa fa-check"></i><b>8.9</b> Conclusión</a></li>
<li class="chapter" data-level="8.10" data-path="modelogenbas.html"><a href="modelogenbas.html#actividades-7"><i class="fa fa-check"></i><b>8.10</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="9" data-path="parentesco.html"><a href="parentesco.html"><i class="fa fa-check"></i><b>9</b> Parentesco y semejanza entre parientes</a>
<ul>
<li class="chapter" data-level="9.1" data-path="parentesco.html"><a href="parentesco.html#parentesco-1"><i class="fa fa-check"></i><b>9.1</b> Parentesco</a></li>
<li class="chapter" data-level="9.2" data-path="parentesco.html"><a href="parentesco.html#parentesco-aditivo"><i class="fa fa-check"></i><b>9.2</b> Parentesco aditivo</a></li>
<li class="chapter" data-level="9.3" data-path="parentesco.html"><a href="parentesco.html#parentesco-de-dominancia"><i class="fa fa-check"></i><b>9.3</b> Parentesco de dominancia</a></li>
<li class="chapter" data-level="9.4" data-path="parentesco.html"><a href="parentesco.html#semejanza-entre-parientes"><i class="fa fa-check"></i><b>9.4</b> Semejanza entre parientes</a></li>
<li class="chapter" data-level="9.5" data-path="parentesco.html"><a href="parentesco.html#estimación-de-las-varianzas-aditiva-y-de-dominancia"><i class="fa fa-check"></i><b>9.5</b> Estimación de las varianzas aditiva y de dominancia</a></li>
<li class="chapter" data-level="9.6" data-path="parentesco.html"><a href="parentesco.html#parentesco-genómico"><i class="fa fa-check"></i><b>9.6</b> Parentesco genómico</a></li>
<li class="chapter" data-level="9.7" data-path="parentesco.html"><a href="parentesco.html#estudios-de-ascendencia-ancestría"><i class="fa fa-check"></i><b>9.7</b> Estudios de ascendencia (“ancestría”)</a></li>
<li class="chapter" data-level="9.8" data-path="parentesco.html"><a href="parentesco.html#conclusión-8"><i class="fa fa-check"></i><b>9.8</b> Conclusión</a></li>
<li class="chapter" data-level="9.9" data-path="parentesco.html"><a href="parentesco.html#actividades-8"><i class="fa fa-check"></i><b>9.9</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="10" data-path="pargen.html"><a href="pargen.html"><i class="fa fa-check"></i><b>10</b> Parámetros genéticos: heredabilidad y repetibilidad</a>
<ul>
<li class="chapter" data-level="10.1" data-path="pargen.html"><a href="pargen.html#heredabilidad"><i class="fa fa-check"></i><b>10.1</b> Heredabilidad</a></li>
<li class="chapter" data-level="10.2" data-path="pargen.html"><a href="pargen.html#heredabilidad-en-sentido-amplio-y-sentido-estricto"><i class="fa fa-check"></i><b>10.2</b> Heredabilidad en sentido amplio y sentido estricto</a></li>
<li class="chapter" data-level="10.3" data-path="pargen.html"><a href="pargen.html#heredabilidad-lograda"><i class="fa fa-check"></i><b>10.3</b> Heredabilidad lograda</a></li>
<li class="chapter" data-level="10.4" data-path="pargen.html"><a href="pargen.html#heredabilidad-en-poblaciones-agronómicaslab.-vs-poblaciones-naturales"><i class="fa fa-check"></i><b>10.4</b> Heredabilidad en poblaciones agronómicas/lab. vs poblaciones naturales</a></li>
<li class="chapter" data-level="10.5" data-path="pargen.html"><a href="pargen.html#heredabilidad-y-filogenética"><i class="fa fa-check"></i><b>10.5</b> Heredabilidad y filogenética</a></li>
<li class="chapter" data-level="10.6" data-path="pargen.html"><a href="pargen.html#heredabilidad-en-la-era-genómica"><i class="fa fa-check"></i><b>10.6</b> Heredabilidad en la era genómica</a></li>
<li class="chapter" data-level="10.7" data-path="pargen.html"><a href="pargen.html#métodos-más-avanzados-de-estimación"><i class="fa fa-check"></i><b>10.7</b> Métodos más avanzados de estimación</a></li>
<li class="chapter" data-level="10.8" data-path="pargen.html"><a href="pargen.html#repetibilidad"><i class="fa fa-check"></i><b>10.8</b> Repetibilidad</a></li>
<li class="chapter" data-level="10.9" data-path="pargen.html"><a href="pargen.html#la-repetibilidad-como-herramienta-en-la-predicción"><i class="fa fa-check"></i><b>10.9</b> La repetibilidad como herramienta en la predicción</a></li>
<li class="chapter" data-level="10.10" data-path="pargen.html"><a href="pargen.html#evolucionabilidad"><i class="fa fa-check"></i><b>10.10</b> Evolucionabilidad</a></li>
<li class="chapter" data-level="10.11" data-path="pargen.html"><a href="pargen.html#conclusión-9"><i class="fa fa-check"></i><b>10.11</b> Conclusión</a></li>
<li class="chapter" data-level="10.12" data-path="pargen.html"><a href="pargen.html#actividades-9"><i class="fa fa-check"></i><b>10.12</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="11" data-path="selartifI.html"><a href="selartifI.html"><i class="fa fa-check"></i><b>11</b> Selección Artificial I</a>
<ul>
<li class="chapter" data-level="11.1" data-path="selartifI.html"><a href="selartifI.html#factores-de-corrección"><i class="fa fa-check"></i><b>11.1</b> Factores de corrección</a></li>
<li class="chapter" data-level="11.2" data-path="selartifI.html"><a href="selartifI.html#la-respuesta-a-la-selección-y-su-predicción"><i class="fa fa-check"></i><b>11.2</b> La respuesta a la selección y su predicción</a></li>
<li class="chapter" data-level="11.3" data-path="selartifI.html"><a href="selartifI.html#diferencial-de-selección-e-intensidad-de-selección"><i class="fa fa-check"></i><b>11.3</b> Diferencial de selección e intensidad de selección</a></li>
<li class="chapter" data-level="11.4" data-path="selartifI.html"><a href="selartifI.html#intensidad-de-selección-y-proporción-seleccionada"><i class="fa fa-check"></i><b>11.4</b> Intensidad de selección y proporción seleccionada</a></li>
<li class="chapter" data-level="11.5" data-path="selartifI.html"><a href="selartifI.html#intervalo-generacional"><i class="fa fa-check"></i><b>11.5</b> Intervalo generacional</a></li>
<li class="chapter" data-level="11.6" data-path="selartifI.html"><a href="selartifI.html#medidas-de-la-respuesta"><i class="fa fa-check"></i><b>11.6</b> Medidas de la respuesta</a></li>
<li class="chapter" data-level="11.7" data-path="selartifI.html"><a href="selartifI.html#progreso-genético-generacional-y-anual"><i class="fa fa-check"></i><b>11.7</b> Progreso genético generacional y anual</a></li>
<li class="chapter" data-level="11.8" data-path="selartifI.html"><a href="selartifI.html#cambio-en-las-frecuencias-alélicas-bajo-selección-artificial"><i class="fa fa-check"></i><b>11.8</b> Cambio en las frecuencias alélicas bajo selección artificial</a></li>
<li class="chapter" data-level="11.9" data-path="selartifI.html"><a href="selartifI.html#el-diferencial-de-selección-direccional-y-la-identidad-de-robertson-price"><i class="fa fa-check"></i><b>11.9</b> El diferencial de selección direccional y la identidad de Robertson-Price</a></li>
<li class="chapter" data-level="11.10" data-path="selartifI.html"><a href="selartifI.html#conclusión-10"><i class="fa fa-check"></i><b>11.10</b> Conclusión</a></li>
<li class="chapter" data-level="11.11" data-path="selartifI.html"><a href="selartifI.html#actividades-10"><i class="fa fa-check"></i><b>11.11</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="12" data-path="correlacionada.html"><a href="correlacionada.html"><i class="fa fa-check"></i><b>12</b> Correlaciones y respuesta correlacionada</a>
<ul>
<li class="chapter" data-level="12.1" data-path="correlacionada.html"><a href="correlacionada.html#causas-genéticas-y-ambientales-de-las-correlaciones"><i class="fa fa-check"></i><b>12.1</b> Causas genéticas y ambientales de las correlaciones</a></li>
<li class="chapter" data-level="12.2" data-path="correlacionada.html"><a href="correlacionada.html#introducción-al-path-analysis"><i class="fa fa-check"></i><b>12.2</b> Introducción al “<em>path analysis</em>”</a></li>
<li class="chapter" data-level="12.3" data-path="correlacionada.html"><a href="correlacionada.html#métodos-para-determinar-la-correlación-genética"><i class="fa fa-check"></i><b>12.3</b> Métodos para determinar la correlación genética</a></li>
<li class="chapter" data-level="12.4" data-path="correlacionada.html"><a href="correlacionada.html#la-correlación-fenotípica-y-su-relación-con-otras-correlaciones"><i class="fa fa-check"></i><b>12.4</b> La correlación fenotípica y su relación con otras correlaciones</a></li>
<li class="chapter" data-level="12.5" data-path="correlacionada.html"><a href="correlacionada.html#respuesta-correlacionada"><i class="fa fa-check"></i><b>12.5</b> Respuesta correlacionada</a></li>
<li class="chapter" data-level="12.6" data-path="correlacionada.html"><a href="correlacionada.html#matrices-de-varianza-covarianza"><i class="fa fa-check"></i><b>12.6</b> Matrices de varianza-covarianza</a></li>
<li class="chapter" data-level="12.7" data-path="correlacionada.html"><a href="correlacionada.html#la-forma-generalizada-de-la-ecuación-del-criador"><i class="fa fa-check"></i><b>12.7</b> La forma generalizada de la ecuación del criador</a></li>
<li class="chapter" data-level="12.8" data-path="correlacionada.html"><a href="correlacionada.html#conclusión-11"><i class="fa fa-check"></i><b>12.8</b> Conclusión</a></li>
<li class="chapter" data-level="12.9" data-path="correlacionada.html"><a href="correlacionada.html#actividades-11"><i class="fa fa-check"></i><b>12.9</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="13" data-path="selartifII.html"><a href="selartifII.html"><i class="fa fa-check"></i><b>13</b> Selección Artificial II</a>
<ul>
<li class="chapter" data-level="13.1" data-path="selartifII.html"><a href="selartifII.html#criterios-y-objetivos-de-selección"><i class="fa fa-check"></i><b>13.1</b> Criterios y objetivos de selección</a></li>
<li class="chapter" data-level="13.2" data-path="selartifII.html"><a href="selartifII.html#selección-basada-en-un-solo-tipo-de-fuente-de-información"><i class="fa fa-check"></i><b>13.2</b> Selección basada en un solo tipo de fuente de información</a></li>
<li class="chapter" data-level="13.3" data-path="selartifII.html"><a href="selartifII.html#combinando-la-información-proporcionada-por-diferentes-tipos-de-parientes"><i class="fa fa-check"></i><b>13.3</b> Combinando la información proporcionada por diferentes tipos de parientes</a></li>
<li class="chapter" data-level="13.4" data-path="selartifII.html"><a href="selartifII.html#métodos-de-selección-para-varias-características"><i class="fa fa-check"></i><b>13.4</b> Métodos de selección para varias características</a></li>
<li class="chapter" data-level="13.5" data-path="selartifII.html"><a href="selartifII.html#índices-de-selección-para-múltiples-características"><i class="fa fa-check"></i><b>13.5</b> Índices de selección para múltiples características</a></li>
<li class="chapter" data-level="13.6" data-path="selartifII.html"><a href="selartifII.html#métodos-y-técnicas-avanzadas-de-selección"><i class="fa fa-check"></i><b>13.6</b> Métodos y técnicas avanzadas de selección</a></li>
<li class="chapter" data-level="13.7" data-path="selartifII.html"><a href="selartifII.html#conclusión-12"><i class="fa fa-check"></i><b>13.7</b> Conclusión</a></li>
<li class="chapter" data-level="13.8" data-path="selartifII.html"><a href="selartifII.html#actividades-12"><i class="fa fa-check"></i><b>13.8</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="14" data-path="endoexo.html"><a href="endoexo.html"><i class="fa fa-check"></i><b>14</b> Endocría, exocría, consanguinidad y depresión endogámica</a>
<ul>
<li class="chapter" data-level="14.1" data-path="endoexo.html"><a href="endoexo.html#el-aumento-de-la-consanguinidad-a-partir-del-número-de-individuos"><i class="fa fa-check"></i><b>14.1</b> El aumento de la consanguinidad a partir del número de individuos</a></li>
<li class="chapter" data-level="14.2" data-path="endoexo.html"><a href="endoexo.html#el-coeficiente-de-consanguinidad-en-razas-lecheras"><i class="fa fa-check"></i><b>14.2</b> El coeficiente de consanguinidad en razas lecheras</a></li>
<li class="chapter" data-level="14.3" data-path="endoexo.html"><a href="endoexo.html#depresión-endogámica"><i class="fa fa-check"></i><b>14.3</b> Depresión endogámica</a></li>
<li class="chapter" data-level="14.4" data-path="endoexo.html"><a href="endoexo.html#exocría-y-heterosis"><i class="fa fa-check"></i><b>14.4</b> Exocría y heterosis</a></li>
<li class="chapter" data-level="14.5" data-path="endoexo.html"><a href="endoexo.html#modelo-genético-de-cruzamientos"><i class="fa fa-check"></i><b>14.5</b> Modelo genético de cruzamientos</a></li>
<li class="chapter" data-level="14.6" data-path="endoexo.html"><a href="endoexo.html#conclusión-13"><i class="fa fa-check"></i><b>14.6</b> Conclusión</a></li>
<li class="chapter" data-level="14.7" data-path="endoexo.html"><a href="endoexo.html#actividades-13"><i class="fa fa-check"></i><b>14.7</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="15" data-path="GxE.html"><a href="GxE.html"><i class="fa fa-check"></i><b>15</b> Normas de reacción e interacción genotipo x ambiente</a>
<ul>
<li class="chapter" data-level="15.1" data-path="GxE.html"><a href="GxE.html#plasticidad-fenotípica-y-normas-de-reacción"><i class="fa fa-check"></i><b>15.1</b> Plasticidad fenotípica y normas de reacción</a></li>
<li class="chapter" data-level="15.2" data-path="GxE.html"><a href="GxE.html#interacción-gxe-en-dos-ambientes"><i class="fa fa-check"></i><b>15.2</b> Interacción GxE en dos ambientes</a></li>
<li class="chapter" data-level="15.3" data-path="GxE.html"><a href="GxE.html#correlación-genética-a-través-de-dos-ambientes"><i class="fa fa-check"></i><b>15.3</b> Correlación genética a través de dos ambientes</a></li>
<li class="chapter" data-level="15.4" data-path="GxE.html"><a href="GxE.html#genética-cuantitativa-de-la-interacción-gxe"><i class="fa fa-check"></i><b>15.4</b> Genética cuantitativa de la interacción GxE</a></li>
<li class="chapter" data-level="15.5" data-path="GxE.html"><a href="GxE.html#otros-ejemplos-de-interacción-genotipo-ambiente"><i class="fa fa-check"></i><b>15.5</b> Otros ejemplos de interacción genotipo-ambiente</a></li>
<li class="chapter" data-level="15.6" data-path="GxE.html"><a href="GxE.html#conclusión-14"><i class="fa fa-check"></i><b>15.6</b> Conclusión</a></li>
<li class="chapter" data-level="15.7" data-path="GxE.html"><a href="GxE.html#actividades-14"><i class="fa fa-check"></i><b>15.7</b> Actividades</a></li>
</ul></li>
<li class="chapter" data-level="" data-path="apéndice-a-conceptos-matemáticos-básicos.html"><a href="apéndice-a-conceptos-matemáticos-básicos.html"><i class="fa fa-check"></i>Apéndice A: Conceptos matemáticos básicos</a>
<ul>
<li class="chapter" data-level="" data-path="apéndice-a-conceptos-matemáticos-básicos.html"><a href="apéndice-a-conceptos-matemáticos-básicos.html#fracciones"><i class="fa fa-check"></i>FRACCIONES</a></li>
<li class="chapter" data-level="" data-path="apéndice-a-conceptos-matemáticos-básicos.html"><a href="apéndice-a-conceptos-matemáticos-básicos.html#proporcionalidad"><i class="fa fa-check"></i>PROPORCIONALIDAD</a></li>
<li class="chapter" data-level="" data-path="apéndice-a-conceptos-matemáticos-básicos.html"><a href="apéndice-a-conceptos-matemáticos-básicos.html#cifras-significativas-y-redondeo"><i class="fa fa-check"></i>CIFRAS SIGNIFICATIVAS Y REDONDEO</a></li>
<li class="chapter" data-level="" data-path="apéndice-a-conceptos-matemáticos-básicos.html"><a href="apéndice-a-conceptos-matemáticos-básicos.html#notación-científica"><i class="fa fa-check"></i>NOTACIÓN CIENTÍFICA</a></li>
<li class="chapter" data-level="" data-path="apéndice-a-conceptos-matemáticos-básicos.html"><a href="apéndice-a-conceptos-matemáticos-básicos.html#ecuaciones"><i class="fa fa-check"></i>ECUACIONES</a></li>
<li class="chapter" data-level="" data-path="apéndice-a-conceptos-matemáticos-básicos.html"><a href="apéndice-a-conceptos-matemáticos-básicos.html#funciones"><i class="fa fa-check"></i>FUNCIONES</a></li>
<li class="chapter" data-level="" data-path="apéndice-a-conceptos-matemáticos-básicos.html"><a href="apéndice-a-conceptos-matemáticos-básicos.html#sumatoria-y-productoria"><i class="fa fa-check"></i>SUMATORIA Y PRODUCTORIA</a></li>
</ul></li>
<li class="chapter" data-level="" data-path="cálculo-diferencial-e-integral.html"><a href="cálculo-diferencial-e-integral.html"><i class="fa fa-check"></i>CÁLCULO DIFERENCIAL E INTEGRAL</a>
<ul>
<li class="chapter" data-level="" data-path="cálculo-diferencial-e-integral.html"><a href="cálculo-diferencial-e-integral.html#límites"><i class="fa fa-check"></i>LÍMITES</a></li>
<li class="chapter" data-level="" data-path="cálculo-diferencial-e-integral.html"><a href="cálculo-diferencial-e-integral.html#gráfica-de-límites_fx"><i class="fa fa-check"></i>GRÁFICA DE LÍMITES_FX</a></li>
<li class="chapter" data-level="" data-path="cálculo-diferencial-e-integral.html"><a href="cálculo-diferencial-e-integral.html#derivadas"><i class="fa fa-check"></i>DERIVADAS</a></li>
<li class="chapter" data-level="" data-path="cálculo-diferencial-e-integral.html"><a href="cálculo-diferencial-e-integral.html#gráfica-de-ptos-críticos"><i class="fa fa-check"></i>GRÁFICA DE PTOS CRÍTICOS</a></li>
<li class="chapter" data-level="" data-path="cálculo-diferencial-e-integral.html"><a href="cálculo-diferencial-e-integral.html#integrales"><i class="fa fa-check"></i>INTEGRALES</a></li>
<li class="chapter" data-level="" data-path="cálculo-diferencial-e-integral.html"><a href="cálculo-diferencial-e-integral.html#ecuaciones-diferenciales"><i class="fa fa-check"></i>ECUACIONES DIFERENCIALES</a></li>
</ul></li>
<li class="chapter" data-level="" data-path="apéndice-c-álgebra-lineal-y-geometría-analítica.html"><a href="apéndice-c-álgebra-lineal-y-geometría-analítica.html"><i class="fa fa-check"></i>Apéndice C: Álgebra lineal y geometría analítica</a>
<ul>
<li class="chapter" data-level="" data-path="apéndice-c-álgebra-lineal-y-geometría-analítica.html"><a href="apéndice-c-álgebra-lineal-y-geometría-analítica.html#matrices"><i class="fa fa-check"></i>MATRICES</a></li>
<li class="chapter" data-level="" data-path="apéndice-c-álgebra-lineal-y-geometría-analítica.html"><a href="apéndice-c-álgebra-lineal-y-geometría-analítica.html#norma-producto-escalar-y-producto-vectorial"><i class="fa fa-check"></i>NORMA, PRODUCTO ESCALAR Y PRODUCTO VECTORIAL</a></li>
<li class="chapter" data-level="" data-path="apéndice-c-álgebra-lineal-y-geometría-analítica.html"><a href="apéndice-c-álgebra-lineal-y-geometría-analítica.html#agregar-imagen-vectores"><i class="fa fa-check"></i>AGREGAR IMAGEN VECTORES</a></li>
<li class="chapter" data-level="" data-path="apéndice-c-álgebra-lineal-y-geometría-analítica.html"><a href="apéndice-c-álgebra-lineal-y-geometría-analítica.html#transformaciones-lineales"><i class="fa fa-check"></i>TRANSFORMACIONES LINEALES</a></li>
<li class="chapter" data-level="" data-path="apéndice-c-álgebra-lineal-y-geometría-analítica.html"><a href="apéndice-c-álgebra-lineal-y-geometría-analítica.html#valores-y-vectores-propios"><i class="fa fa-check"></i>VALORES Y VECTORES PROPIOS</a></li>
<li class="chapter" data-level="" data-path="apéndice-c-álgebra-lineal-y-geometría-analítica.html"><a href="apéndice-c-álgebra-lineal-y-geometría-analítica.html#derivada-de-la-forma-cuadrática"><i class="fa fa-check"></i>DERIVADA DE LA FORMA CUADRÁTICA</a></li>
</ul></li>
<li class="chapter" data-level="" data-path="apéndice-d-probabilidad-y-estadística.html"><a href="apéndice-d-probabilidad-y-estadística.html"><i class="fa fa-check"></i>Apéndice D: Probabilidad y estadística</a>
<ul>
<li class="chapter" data-level="" data-path="apéndice-d-probabilidad-y-estadística.html"><a href="apéndice-d-probabilidad-y-estadística.html#probabilidad-y-conteo"><i class="fa fa-check"></i>PROBABILIDAD Y CONTEO</a></li>
<li class="chapter" data-level="" data-path="apéndice-d-probabilidad-y-estadística.html"><a href="apéndice-d-probabilidad-y-estadística.html#variables-aleatorias"><i class="fa fa-check"></i>VARIABLES ALEATORIAS</a></li>
<li class="chapter" data-level="" data-path="apéndice-d-probabilidad-y-estadística.html"><a href="apéndice-d-probabilidad-y-estadística.html#estimadores"><i class="fa fa-check"></i>ESTIMADORES</a></li>
</ul></li>
<li class="chapter" data-level="16" data-path="bibliografia.html"><a href="bibliografia.html"><i class="fa fa-check"></i><b>16</b> Bibliografía</a></li>
<li class="divider"></li>
<li><a href="https://github.com/rstudio/bookdown" target="blank">Published with bookdown</a></li>
</ul>
</nav>
</div>
<div class="book-body">
<div class="body-inner">
<div class="book-header" role="navigation">
<h1>
<i class="fa fa-circle-o-notch fa-spin"></i><a href="./">Introducción a la Genética de Poblaciones y a la Genética Cuantitativa</a>
</h1>
</div>
<div class="page-wrapper" tabindex="-1" role="main">
<div class="page-inner">
<section class="normal" id="section-">
<div id="intro" class="section level1 hasAnchor" number="1">
<h1><span class="header-section-number">Capítulo 1</span> Introducción a la Genómica<a href="intro.html#intro" class="anchor-section" aria-label="Anchor link to header"></a></h1>
<p>El presente capítulo es una somera introducción a la genómica y apenas tiene como cometido el asegurarnos de que algunos conceptos básicos sobre la misma, que usaremos durante el curso, se encuentren disponibles. El foco del mismo es en diferentes metodologías para el estudio de los genomas, muchas de las cuales usaremos en distintos ejemplos y secciones del curso. Poco esfuerzo se hace por explicar las bases de la herencia y la estructura y organización de los genomas eucariotas y procariotas, las cuales se asumen conocidas.</p>
<p>Los organismos en nuestro planeta derivan todos de un organismo ancestral, desconocido, y por lo tanto es de esperar que sus genomas compartan determinadas características. Sin embargo, al mismo tiempo podemos observar una enorme diversidad entre los mismos, por lo que resulta fundamental entender los procesos que llevan a esas diferencias. Dichos procesos operan sobre el componente heredable de los organismos, su material genético. El mismo está compuesto por una secuencia ordenada de nucleótidos, por lo cual es común referirse a este coloquialmente como <em>secuencia/s</em> en el ámbito de la genómica y las disciplinas afines. Conocer las secuencias de los genomas de diferentes organismos y compararlas para determinar las diferencias entre estas es, por lo tanto, el primer paso a dar para comprender los procesos que llevaron a dichas diferencias. La secuenciación de genomas es una historia que comenzó en las últimas décadas del siglo pasado y desde ese momento no ha dejado de crecer, en ciertos momentos a velocidad vertiginosa. En particular, la aparición de las denominadas tecnologías de segunda y tercera generación ha permitido pasar de la secuenciación de un genoma por especie a la secuenciación de cientos o miles de individuos de una misma especie. De esta forma, en la acutalidad se está logrando caracterizar mucho mejor la variabilidad biológica existente.</p>
<p>La diversidad existente a nivel de organismos macroscópicos es evidente. El ser humano interacciona con la flora y la fauna desde sus inicios como especie. Entender, preservar e influir sobre esta diversidad biológica es lo que ha permitido en última instancia el desarrollo de las civilizaciones. Resulta intuitivo que enriquecer nuestra comprensión de esta diversidad con aportes desde la genómica pueda resultar valioso. Por otra parte, aunque invisibles los microorganismos juegan un papel relevante en casi todos los ecosistemas a diferentes escalas: desde bosques, praderas, ríos y mares a los ecosistemas internos (<em>e.g.</em>, aparato digestivo) y externos (piel) de los organismos. A pesar de su importancia, la diversidad microbiana apenas ha sido explorada, fundamentalmente debido a las dificultades asociadas al cultivo de los microorganismos, muchos de ellos directamente no-cultivables. En este sentido, también la genómica ha jugado un rol destacado en los avances que se han producido en este campo en los últimos años. La <em>metagenómica</em>, la <em>metagenómica funcional</em> y la <em>metatranscriptómica</em> han contribuido a entender la composición de los ecosistemas microbianos, las funciones de los genes involucrados y la regulación de su expresión, respectivamente. Mencionaremos cada una de estas aproximaciones en secciones posteriores de este capítulo.</p>
<p>Aunque a primera vista la informática y la biología puedan parecer áreas de estudio muy alejadas (¿qué se aleja más de la vida que una fría máquina?), veremos que la obtención y procesamiento masivo de datos biológicos han permitido enriquecer de forma importante la perspectiva que tenemos sobre los organismos vivos y la transmisión de información de generación en generación, tanto a nivel individual como poblacional. A lo largo del libro iremos profundizando en esta perspectiva, empleando recursos informáticos para modelar procesos de la genética poblacional y cuantitativa, haciendo un uso enriquecedor de las tecnologías disponibles en la actualidad.<br />
</p>
<div class="boxobjetivos">
<div class="boxobjetivos-header">
<p><strong>OBJETIVOS DEL CAPÍTULO</strong></p>
</div>
<p><span class="math inline">\(\square\)</span> Abordar el fenómeno de la variabilidad genética, discutiendo el uso de métricas que nos permiten cuantificar la misma e introduciendo tecnologías que nos permiten la identificación de variantes genéticas en poblaciones.
</p>
<p><span class="math inline">\(\square\)</span> Obtener una perspectiva de las distintas áreas de estudio de la genómica, incluyendo:
- el estudio de la composición nucleotídica de los genomas
- el estudio evolutivo de los organismos
- el análisis de los patrones de expresión génica
</p>
<p><span class="math inline">\(\square\)</span> Repasar conceptos básicos de genética y biología molecular, ilustrando en cada caso cómo uso de herramientas estadísticas y computacionales enriquece nuestra perspectiva de los fenómenos biológicos.</p>
</div>
<div id="variabilidad-genética" class="section level2 hasAnchor" number="1.1">
<h2><span class="header-section-number">1.1</span> Variabilidad genética<a href="intro.html#variabilidad-genética" class="anchor-section" aria-label="Anchor link to header"></a></h2>
<p>Todos los organismos presentan diferencias observables (<em>fenotípicas</em>) entre ellos. Muchas de estas son producto del desarrollo en determinados ambientes (específicas para cada individuo), mientras que otras se corresponden a las diferencias en el genoma. Excepto los clones (copias idénticas de un mismo individuo), todos los organismos son de alguna manera diferentes entre sí. Aún entre gemelos es posible postular que la <strong><em>epigenética</em></strong><a href="#fn5" class="footnote-ref" id="fnref5"><sup>5</sup></a> puede jugar un rol diferente en su desarrollo. Estas diferencias a nivel genético o genómico son las que nos resultan fundamentales cuando hablamos de mejorar una especie de nuestro interés o en cualquier instancia en la que busquemos seleccionar algunos individuos de una población.</p>
<p>Muchas otras veces estamos más interesados en entender las diferencias entre especies y el rol que juegan las proporciones de individuos de las mismas en la dinámica de un ecosistema. Claramente, la robustez de un ecosistema suele estar asociada al balance de diversas especies, cada una jugando roles diferentes. Pero ese balance no solo depende de la presencia de algún miembro de cada especie, sino de las proporciones que esas especies ocupan en el ecosistema. Tener índices que nos permitan cuantificar y comparar la diversidad existente en diferentes escenarios resulta por lo tanto útil. Tradicionalmente, en ecología se definen tres tipos de medidas de diversidad: la <em>diversidad alfa</em>, la <em>diversidad beta</em> y la <em>diversidad gamma</em>, de acuerdo a la escala del fenómeno estudiado.</p>
<p>Se llama <strong><em>diversidad alfa</em></strong> a la que describe la diversidad de especies dentro de una comunidad<a href="#fn6" class="footnote-ref" id="fnref6"><sup>6</sup></a> a una escala pequeña o local. Esta escala es normalmente del tamaño de un ecosistema y es a la que generalmente nos referimos al hablar de una zona.</p>
<p>La <strong><em>diversidad beta</em></strong> describe la diversidad de especies entre dos comunidades o ecosistemas. Involucra una escala mayor, ya que incluye ecosistemas (que correspondían a la diversidad alfa) y en general suele haber alguna distinción geográfica o barrera importante entre las comunidades de referencia.</p>
<p>La <strong><em>diversidad gamma</em></strong> se refiere a una escala de estudio mucho mayor (<em>e.g.</em>, un bioma), donde se compara la diversidad de especies entre muchos ecosistemas.</p>
<p>Aunque la diversidad biológica puede cuantificarse de muchas maneras diferentes, los dos factores principales que se tienen en cuenta para medir la diversidad son la <strong><em>riqueza</em></strong> y la <strong><em>uniformidad</em></strong>. La riqueza representa el número de tipos (especies) diferentes entre todos los que identificamos en el área de interés. Sin embargo, nuestra intuición nos dice que la uniformidad representa también una parte importante de la diversidad. Es decir, si en un ambiente tenemos 1 individuo de cada una de 4 especies y 996 individuos de una quinta especie, claramente identificaremos una menor diversidad respecto a otro ambiente que tiene 200 individuos de cada una de las especies. En general, la uniformidad compara la similitud del tamaño de la población de cada una de las especies presentes.</p>
<p>Para cada uno de estos tipos de diversidad se han desarrollado índices que permiten obtener estimaciones de su importancia relativa a otros sistemas. Por ejemplo para la diversidad alfa el índice más sencillo de entender es la <em>entropía de Shannon</em> (llamada así por el matemático Claude Shannon que la propuso para un problema de transmisión de información), que mide la incertidumbre al asignar la identidad de un individuo elegido al azar de la población. Si le llamamos <span class="math inline">\(p_i\)</span> a la proporción (frecuencia relativa) de individuos de la especie <span class="math inline">\(i\)</span>, de un total de <span class="math inline">\(k\)</span> especies identificadas en el ecosistema, entonces el <strong><em>índice de Shannon</em></strong> se calcula como</p>
<div class="equationbox">
<p><span class="math display" id="eq:alphadiver1">\[\begin{equation}
H'=-\sum^k_{i=1} p_i \ln p_i
\tag{1.1}
\end{equation}\]</span></p>
</div>
<p>Es decir, cada frecuencia es multiplicada por su logaritmo y sumada, con el resultado final multiplicado por <span class="math inline">\(-1\)</span> ya que cualquiera de los logartitmos será menor o igual a cero (porque para todas las especies <span class="math inline">\(0 \leqslant p_i \leqslant 1\)</span>). En el caso de una sola especie <span class="math inline">\(\ln p_i=\ln 1=0\)</span>, por lo que la diversidad será cero. Cuanto más homogéneo sea el reparto de las especies, mayor será el índice de Shannon. En particular, el máximo del índice de Shannon se dará cuando <span class="math inline">\(p_i=\frac{N/k}{N}=\frac{1}{k}\ \forall \ i\)</span>, en cuyo caso</p>
<p><span class="math display" id="eq:alphadiver1p1">\[
\begin{split}
H_{max}=-\sum^k_{i=1} \frac{1}{k} \ln \frac{1}{k}=\\
=k\ \frac{1}{k} [\ln 1 -\ln k]=-[0-\ln k] \therefore \\
H_{max}=\ln k
\end{split}
\tag{1.2}
\]</span></p>
<p>Es decir, el máximo del índice será el logaritmo del número de especies, lo que ocurre cuando todas las especies tienen el mismo número de integrantes.
Podemos ver entonces que el índice de Shannon no sólo nos permite comparar la diversidad biológica de forma cuantitativa, sino que además nos permite predecir bajo qué condiciones ésta se maximiza. Lo que es más, esta predicción se corresponde con nuestra intuición de que una mayor diversidad debe reflejar un reparto más equitativo de los individuos para las diferentes especies (concepto de uniformidad mencionado anteriormente).</p>
<p>Resulta claro que los valores que se pueden obtener para el índice de Shannon dependerán del número de especies presentes (<span class="math inline">\(k\)</span>) en el ecosistema estudiado.
En este sentido, resulta útil un índice relacionado directamente al índice de Shannon es el propuesto por <span class="citation">Pielou (<a href="#ref-Pielou1969">1969</a>)</span>, que estandariza el índice de Shannon por la riqueza, lo que lo deja como un índice de uniformidad (“<em>evenness</em>”, en inglés) que se calcular como</p>
<p><span class="math display" id="eq:alphadiver1p2">\[\begin{equation}
E=\frac{H'}{H_{max}}=\frac{H'}{\ln k}
\tag{1.3}
\end{equation}\]</span></p>
<p>Así, es posible tener una noción más clara respecto a la diversidad alfa presente en el ecosistema estudiado: cuanto más se acerca este índice <span class="math inline">\(E\)</span> a 1, más cerca se estará del máximo teórico según el índice de Shannon.</p>
<p>Otro índice popular es el <strong><em>índice de Simpson</em></strong>. El índice de Simpson (<span class="math inline">\(D\)</span>) mide la probabilidad de que dos individuos seleccionados al azar de una muestra pertenezcan a la misma especie o categoría. Es decir, si <span class="math inline">\(n_i\)</span> representa el número de individuos de la especie o categoría <span class="math inline">\(i\)</span> y <span class="math inline">\(N\)</span> el número total de individuos, es decir <span class="math inline">\(N=\sum_i n_i\)</span>, entonces</p>
<div class="equationbox">
<p><span class="math display" id="eq:alphadiver2">\[\begin{equation}
D=\sum^k_{i=1} \frac{n_i(n_i-1)}{N(N-1)}
\tag{1.4}
\end{equation}\]</span></p>
</div>
<p>La intuición de este índice es que si los individuos se concentran en pocos tipos diferentes el valor de <span class="math inline">\(D\)</span> será más alto, es decir lo contrario a lo que esperaríamos para un índice de diversidad. De hecho, con este índice 0 representa una diversidad infinita y 1, ninguna diversidad. Es decir, cuanto mayor sea el valor de <span class="math inline">\(D\)</span>, menor será la diversidad. Para superar este problema, se suele restar a 1 el valor de <span class="math inline">\(D\)</span>, es decir se reporta <span class="math inline">\(1-D\)</span>. Otra alternativa es reportar el recíproco de <span class="math inline">\(D\)</span>, es decir <span class="math inline">\(1/D\)</span>. Cuando el número de individuos es muy grande, entonces en general <span class="math inline">\(\frac{n_i -1}{N-1} \to \frac{n_i}{N}\)</span>, por lo que</p>
<p><span class="math display" id="eq:alphadiver2p1">\[
\begin{split}
D=\sum^k_{i=1} \frac{n_i(n_i-1)}{N(N-1)}=\sum^k_{i=1} \frac{n_i}{N}\frac{(n_i-1)}{(N-1)} \approx \sum^k_{i=1} \frac{n_i}{N}\frac{(n_i)}{(N)} \therefore \\
D \approx \sum^k_{i=1} \frac{n^2_i}{N^2}
\end{split}
\tag{1.5}
\]</span></p>
<p>Notemos que hasta el momento no se han tenido en cuenta posibles errores al momento de determinar el número de especies <em>k</em> presentes en una muestra (<em>e.g.</em> por falta de muestreo de organismos de una especie presente en el ecosistema en números muy bajos).</p>
<p>El <strong><em>índice de cobertura de Good</em></strong> es usado a veces como estimador de diversidad alfa y se calcula mediante la siguiente ecuación:</p>
<p><span class="math display" id="eq:alphadiver3">\[\begin{equation}
C=1-\frac{F_1}{N}
\tag{1.6}
\end{equation}\]</span></p>
<p>donde <span class="math inline">\(F_1\)</span> es el número de <strong>OTUs</strong> (“<em>Operational Taxonomic Units</em>”; Unidades Taxonómicas Operacionales, en inglés) en la muestra con un solo representante. <strong>OTU</strong> es una forma de expresar una unidad taxónomica particular a un nivel de la taxonomía determinado. Por ejemplo, en algunos casos las <strong>OTUs</strong> pueden representar especies, pero otras veces representan niveles más altos o más bajos de la taxonomía (de ahí el término “<em>operacional</em>”). La idea del índice es capturar de alguna manera la probabilidad de perder <strong>OTUs</strong> debido a un tema de muestreo. Es decir, aquellas <strong>OTUs</strong> que no fueron secuenciadas pero que se encontraban presentes, las cuales se hallarían de haberse realizado muestreos con tamaños muestrales mucho mayores.</p>
<p>La diversidad juega un papel fundamental en la resiliencia de los sistemas, tanto la diversidad entre especies como dentro de especies. Por ejemplo, la pérdida de diversidad asociada a la revolución verde entre la década del 60 y del 80 del siglo XX representa una pérdida irrecuperable de patrimonio genético desarrollado durante miles y millones de años. Lamentablemente, es poco probable que la biotecnología pueda recuperar en breve lo que la naturaleza desarrolló durante millones de años, por lo que resulta trascendental pensar en conservar la diversidad en nuestro planeta.</p>
<div id="ejemplo-1.1" class="section level3 unnumbered hasAnchor">
<h3>Ejemplo 1.1<a href="intro.html#ejemplo-1.1" class="anchor-section" aria-label="Anchor link to header"></a></h3>
<p>Luego de un muestreo realizado a partir de <strong><em>metagenómica</em></strong> en dos ambientes diferentes, la distribución de especies (<strong><em>OTUs</em></strong>) en los mismos es la siguiente:</p>
<table class="table" style="margin-left: auto; margin-right: auto;">
<thead>
<tr>
<th style="text-align:left;">
Especie
</th>
<th style="text-align:left;">
Ambiente.1
</th>
<th style="text-align:left;">
Ambiente.2
</th>
</tr>
</thead>
<tbody>
<tr>
<td style="text-align:left;">
OTU 1
</td>
<td style="text-align:left;">
<span class="math inline">\(60\)</span>
</td>
<td style="text-align:left;">
<span class="math inline">\(1\)</span>
</td>
</tr>
<tr>
<td style="text-align:left;">
OTU 2
</td>
<td style="text-align:left;">
<span class="math inline">\(150\)</span>
</td>
<td style="text-align:left;">
<span class="math inline">\(1\)</span>
</td>
</tr>
<tr>
<td style="text-align:left;">
OTU 3
</td>
<td style="text-align:left;">
<span class="math inline">\(0\)</span>
</td>
<td style="text-align:left;">
<span class="math inline">\(297\)</span>
</td>
</tr>
<tr>
<td style="text-align:left;">
OTU 4
</td>
<td style="text-align:left;">
<span class="math inline">\(390\)</span>
</td>
<td style="text-align:left;">
<span class="math inline">\(1\)</span>
</td>
</tr>
<tr>
<td style="text-align:left;">
OTU 5
</td>
<td style="text-align:left;">
<span class="math inline">\(400\)</span>
</td>
<td style="text-align:left;">
<span class="math inline">\(700\)</span>
</td>
</tr>
<tr>
<td style="text-align:left;">
Total
</td>
<td style="text-align:left;">
<span class="math inline">\(1000\)</span>
</td>
<td style="text-align:left;">
<span class="math inline">\(1000\)</span>
</td>
</tr>
</tbody>
</table>
<p>Calcular los difentes índices para los dos ambientes y discutir los resultados.</p>
<p>Como el total de “individuos” (<strong><em>reads</em></strong>) obtenidos en ambas muestras es <span class="math inline">\(1000\)</span>, alcanza con dividir entre ese número para tener la frecuencia relativa. Por lo tanto, utilizando la ecuación <a href="intro.html#eq:alphadiver1">(1.1)</a> el índice de Shannon para el primer ambiente es igual a</p>
<p><span class="math display">\[
\begin{split}
H'*1=-\sum^k*{i=1} p_i \ln p_i =\\
=-[0,06 \times \ln 0,06 + 0,15 \times \ln 0,15 + 0,39 \times \ln 0,39 +\\
- 0,4 \times \ln 0,4] \therefore \\
H'_1=1,1871
\end{split}
\]</span></p>
<p>mientras que para el segundo ambiente el mismo es</p>
<p><span class="math display">\[
\begin{split}
H'*2=-\sum^k*{i=1} p_i \ln p_i =\\
=-[0,001 \times \ln 0,001 + 0,001 \times \ln 0,001 + 0,297 \times \ln 0,297 +\\
+0,001 \times \ln 0,001 + 0,7 \times \ln 0,7] \therefore \\
H'_2=0,63096
\end{split}
\]</span></p>
<p>Notar que en el <strong>Ambiente 1</strong> no se encontró la especie <strong>OTU 3</strong>, por lo que no se incluye en los cálculos (de hecho <span class="math inline">\(\ln 0=-\infty\)</span>). De acuerdo con esto, según el <strong>índice de Shannon</strong> el <strong>Ambiente 1</strong> es más diverso que el <strong>Ambiente 2</strong>. Para medir la uniformidad utilizando el índice propuesto por Pielou (1969), primero tenemos que calcular el máximo posible para el índice de Shannon, que a partir de la ecuación <a href="intro.html#eq:alphadiver1p1">(1.2)</a> sabemos que es igual al logaritmo del número de <strong>OTUs</strong>, es decir <span class="math inline">\(H_{max_1}=\ln k=\ln 4=1,3863\)</span> y <span class="math inline">\(H_{max_2}=\ln k=\ln 5=1,6094\)</span>. Por lo tanto, aplicando la ecuación <a href="intro.html#eq:alphadiver1p2">(1.3)</a>, tenemos que el índice de uniformidad para los dos ambientes será</p>
<p><span class="math display">\[
\begin{split}
E_1=\frac{H'*1}{H*{max_1}}=\frac{1,1871}{1,3863}= 0,8563 \\
E_2=\frac{H'*2}{H*{max_2}}=\frac{0,63096}{1,6094}= 0,3920
\end{split}
\]</span></p>
<p>lo que habla de una uniformidad mucho menor en el <strong>Ambiente 2</strong>.</p>
<p>Para el índice de Simpson vamos a utilizar la ecuación <a href="intro.html#eq:alphadiver2">(1.4)</a>, por lo que para el <strong>Ambiente 1</strong> el mismo será</p>
<p><span class="math display">\[
\begin{split}
D_1=\sum^k_{i=1} \frac{n_i(n_i-1)}{N(N-1)}=\\
=\left[\frac{60(59)+150(149)+390(389)+400(399)}{1000 \times 999}\right]=0,3375
\end{split}
\]</span></p>
<p>mientras que para el <strong>Ambiente 2</strong> su valor será</p>
<p><span class="math display">\[
\begin{split}
D_2=\sum^k_{i=1} \frac{n_i(n_i-1)}{N(N-1)}=\\
=\left[\frac{1(0)+1(0)+297(296)+1(0)+700(699)}{1000 \times 999}\right]=0,5778
\end{split}
\]</span></p>
<p>Si utilizamos el criterio de reportar <span class="math inline">\(1-D\)</span>, entonces <span class="math inline">\(1-D_1=1-0,6625\)</span>, mientras que <span class="math inline">\(1-D_2=1-0,4222\)</span>. Si utilizamos el criterio del recíproco, entonces <span class="math inline">\(1/D_1=2,9626\)</span> y <span class="math inline">\(1/D_2=1,7307\)</span>, por lo que se aprecia claramente que la diversidad en el <strong>Ambiente 1</strong> es mayor que la del <strong>Ambiente 2</strong> de acuerdo a este índice.</p>
<p>Finalmente, de acuerdo a la ecuación <a href="intro.html#eq:alphadiver3">(1.6)</a>, teniendo en cuenta que en el primer ambiente no hay ningún OTU con un único representante mientras que en el segundo hay 3, el <strong>índice de cobertura de Good</strong> para los dos ambientes sería</p>
<p><span class="math display">\[
\begin{split}
C_1=1-\frac{0}{1000}=1 \\
C_2=1-\frac{3}{1000}=0,997
\end{split}
\]</span></p>
<div class="graybox">
<div class="graybox-header">
<p><strong>PARA RECORDAR</strong></p>
</div>
<ul>
<li><p>Tradicionalmente, en ecología se definen tres tipos de medidas de diversidad de acuerdo a la escala del fenómeno estudiado:</p>
<ul>
<li>Se llama <strong><em>diversidad alfa</em></strong> a la que describe la diversidad de especies dentro de una comunidad a una escala pequeña o local. Esta escala es normalmente del tamaño de un ecosistema y es a la que generalmente nos referimos al hablar de una zona.</li>
<li>La <strong><em>diversidad beta</em></strong> describe la diversidad de especies entre dos comunidades o ecosistemas. Involucra una escala mayor, ya que incluye ecosistemas (que correspondían a la diversidad alfa) y en general suele haber alguna distinción geográfica o barrera importante entre las comunidades de referencia.</li>
<li>La <strong><em>diversidad gamma</em></strong> se refiere a una escala de estudio mucho mayor (<em>e.g.</em>,un bioma), donde se compara la diversidad de especies entre muchos ecosistemas.</li>
</ul></li>
<li><p>Aunque la diversidad biológica puede cuantificarse de muchas maneras diferentes, los dos factores principales que se tienen en cuenta para medir la diversidad son la <strong><em>riqueza</em> y la <em>uniformidad</em></strong>. La <strong><em>riqueza</em></strong> representa el número de tipos (especies) diferentes entre todos los que identificamos en el área de interés, mientras que la <strong><em>uniformidad</em></strong> compara la similitud del tamaño de la población de cada una de las especies presentes.</p></li>
<li><p>Para la diversidad alfa, el índice más sencillo de entender es la <em>entropía de Shannon</em>, que mide la incertidumbre al asignar la identidad de un individuo elegido al azar de la población. Si le llamamos <span class="math inline">\(p_i\)</span> a la proporción (frecuencia relativa) de individuos de la especie <span class="math inline">\(i\)</span>, de un total de <span class="math inline">\(k\)</span> especies identificadas en el ecosistema, entonces el <strong><em>índice de Shannon</em></strong> se calcula como: <span class="math inline">\(H'=-\sum^k_{i=1} p_i \ln p_i\)</span>.
Cuanto más homogéneo sea el reparto de las especies, mayor será el índice de Shannon. El máximo del mismo será cuando todas las especies tienen el mismo número de integrantes.</p></li>
<li><p>El <strong><em>índice de Simpson</em> (<span class="math inline">\(D\)</span>)</strong> mide la probabilidad de que dos individuos seleccionados al azar de una muestra pertenezcan a la misma especie o categoría. Es decir, si <span class="math inline">\(n_i\)</span> representa el número de individuos de la especie o categoría <span class="math inline">\(i\)</span> y <span class="math inline">\(N\)</span> el número total de individuos (<em>i.e.</em>, <span class="math inline">\(N=\sum_i n_i\)</span>), entonces <span class="math inline">\(D=\sum^k_{i=1} \frac{n_i(n_i-1)}{N(N-1)}\)</span>. La intuición de este índice es que si los individuos se concentran en pocos tipos diferentes el valor de <span class="math inline">\(D\)</span> será más alto, al contrario de lo que esperaríamos para un índice de diversidad. Para superar este problema, se suele restar a 1 el valor de <span class="math inline">\(D\)</span> (se reporta <span class="math inline">\(1-D\)</span>).</p></li>
</ul>
</div>
</div>
<div id="detectando-la-variabilidad-diferentes-técnicas" class="section level3 hasAnchor" number="1.1.1">
<h3><span class="header-section-number">1.1.1</span> Detectando la variabilidad: diferentes técnicas<a href="intro.html#detectando-la-variabilidad-diferentes-técnicas" class="anchor-section" aria-label="Anchor link to header"></a></h3>
<p>En las últimas décadas han ganado una enorme relevancia un conjunto de disciplinas con base en avances tecnológicos que permiten la obtención masiva de información biológica global para una condición dada. Esto se logra a través de la automatización de diversos protocolos de bioquímica y biología molecular, tales como la secuenciación de nucleótidos o péptidos provenientes de una muestra biológica. Estas disciplinas son identificables por la utilización del sufijo “<em>-ómica</em>” en su nombre. La <em>genómica</em> es una de estas disciplinas, focalizándose en el estudio del genoma de diferentes organismos a través de las tecnologías de secuenciación masiva. Existen también la <em>transcriptomica</em> (estudio global de los transcriptos expresados por un organismo o conjunto de células), la <em>proteómica</em> (estudio de las proteńas expresadas en una condición dada) o la <em>metabolómica</em> (estudio del perfil metabólico), entre otros. Este enfoque de análisis también se puede aplicar para estudiar varios organismos a la vez (<em>e.g.</em> al tomarse muestras ambientales), surgiendo así un subconjunto de discplinas “meta-”. A modo de ejemplo, la metagenómica se encarga del ensamblado y estudio de genomas microbianos en muestras provenientes de diferentes lugares. En la Sección <a href="intro.html#metagenomica-y-metatranscriptomica">Metagenómica y metatranscriptómica</a> se detalla un esquema típico de trabajo en metagenómica. Como es de esperar, estas técnicas de obtención masiva de datos han impactado de forma notable nuestro entendimiento de la variabilidad genética entre organismos.</p>
<p>Para entender la variabilidad genética es necesario determinar algún marcador genético cuyas variantes podamos detectar en muchos individuos (<em>e.v.</em>, obteniendo las secuencias para el marcador en esta muestra). Un ejemplo de estudios iniciales de diversidad genética es la utilización de grupos sanguíneos, el cual veremos en el próximo capítulo. Hasta hace algunos años la búsqueda de marcadores fiables de diversidad genética representaba un enorme desafío, y se desarrollaron una plétora de métodos para obtener marcadores moleculares de diversidad. Tanto el trabajo como los costos eran enormes, lo que dificultaba el desarrollo de estudios a gran escala en este sentido. Afortunadamente, a fines del siglo XX las técnicas de secuenciación masiva habían avanzado lo suficiente como para incluir centenas de individuos en los estudios. Más aún, el desarrollo de técnicas como los <strong><em>microarrays</em></strong> posibilitaron la automatización de muchos análisis (en especial los de expresión), pero también resultaron fundamentales a la hora de abaratar los costos para estudios masivos de diversidad.</p>
<p>Los <strong><em>microarrays</em></strong> son un arreglo de <strong>sondas moleculares</strong> colocadas en una placa. Originalmente contenían apenas unas decenas de sondas; la robotización y la aplicación de tecnologías que se usan en la fabricación de semiconductores permitieron alcanzar densidades del orden del millón de sondas por <em>array</em> (placa). Una sonda molecular, en este caso, es una secuencia específica para un gen (o una región de un gen) y que es, idealmente, única en el genoma de referencia. Esta sonda se encuentra fija en la placa, y la hibridación del <strong>ADN</strong> o el <strong>ADN copia</strong> (en los estudios de transcriptómica) de un individuo es acoplada a algún tipo de señal (<em>e.g.</em>, emisión de luz en determinada frecuencia al ser iluminada por un <strong>láser</strong>). La presencia de señal permite se asocia, por lo tanto, a la presencia del ADN de interés en la muestra proveniente del individuo.</p>
<p>Esta tecnología permite, por ejemplo, identificar si la secuencia presente en el organismo es de un tipo u otro en el caso de los <strong>SNPs</strong> (polimorfismos de un solo nucleótido). En el caso de las especies diploides, es posible identificar el genotipo para un organismo. Para conocer la diversidad del genoma humano es usual utilizar chips de densidad media (10-60K de SNPs) o de alta densidad (hasta un millón de SNPs). En especies de interés comercial existen diferentes tipos de alternativas, desde <em>arrays</em> de baja densidad (apenas unos pocos miles de SNPs), media, hasta los de alta densidad, como el <strong>BovineHD</strong> que comprende más de 777 mil SNPs, compatible con todas las razas bovinas lecheras o de carne.</p>
<p>A pesar del enorme éxito de los <em>microarrays</em> para estudiar la diversidad genética en diversas poblaciones de diferentes especies, los mismos padecen de un problema fundamental: para crear una sonda para medir variabilidad hay que conocer las secuencias de regiones que contengan variabilidad. Es decir, para estudiar la variabilidad mediante esta técnica hay que tener alguna información previa de qué regiones son variables. Esto se debe a que la suma de los tamaños de las sondas son extremadamente pequeños en relación al largo total de los genomas. Por ejemplo, en genoma humano un chip de alta densidad cubre 1 millón de posiciones de las más de 3.000 millones que tiene el genoma (~0.0003%). Para elegir bien ese millón de posiciones hay que tener muy buena información previa: si se eligen posiciones que casi no varíen en la población, se obtendrá muy poca información sobre la variabilidad genética en las poblaciones estudiadas. Además, otro problema derivado de los <em>microarrays</em> y de este sesgo en los marcadores a incluir es que luego de diseñado el <em>array</em> solo va a captar variabilidad en las posiciones del genoma para el que fue diseñado. Si una nueva población aparece con variabilidad importante en otras regiones, el <em>array</em> no va a ser capaz de detectarlo. Por ejemplo, en genoma humano, hasta hace poco tiempo los <em>arrays</em> poseían un importante sesgo “eurocéntrico”, porque la mayor parte de la información previa venía de Europa. Esto dejaba fuera de los mismos sitios de alta variabilidad en poblaciones asiáticas o amerindias, por ejemplo. Estudios que utilizaran dichos <em>arrays</em> terminarían determinando que estas poblaciones tenían menos variabilidad genética que la real.</p>
<p>Afortunadamente, las <strong>tecnologías de secuenciación masiva</strong> que se desarrollaron a comienzo del siglo XXI cambiaron definitivamente el panorama, ya que permiten obtener las secuencias de decenas o cientos de individuos a precio y tiempos razonables. Como referencia, el esfuerzo global para obtener la secuencia del primer genoma humano llevó más de 10 años a decenas de laboratorios repartidos en el mundo, y costó más de 3.000 millones de dólares. Actualmente, un genoma humano tarda en secuenciarse menos de una semana (el record mundial, establecido recientemente, es de 5 horas y 2 minutos) y cuesta en promedio unos mil dólares (sin incluir los costos del análisis posterior). Más aún, si bien las tecnologías de segunda generación (<strong>Roche 454</strong>, <strong>Illumina</strong> y <strong>SOLiD</strong>) tuvieron un éxito enorme, la flexibilidad de las mismas era algo limitada y en particular era muy difícil reducir los tiempos de secuenciación, además de tener ciertos sesgos específicos en los resultados. En la segunda década de este siglo comenzaron a aparecer y consolidarse otras nuevas tecnologías, que se dieron en llamar de tercera generación y que incluyen los secuenciadores <strong>IonTorrent</strong>, los de <strong>Oxford Nanopore Technologies</strong> y los <strong>PacBio</strong>. En conjunto, estas tecnologías, sumadas a <strong>Illumina</strong> que es la única de las de segunda generación que sobrevive con mucho éxito, permiten tener una flexibilidad enorme en tamaños y costos de equipamientos y reactivos, en sesgos y distribución de errores, así como en la velocidad de secuenciación.</p>
</div>
<div id="metagenomica-y-metatranscriptomica" class="section level3 hasAnchor" number="1.1.2">
<h3><span class="header-section-number">1.1.2</span> Metagenómica y metatranscriptómica<a href="intro.html#metagenomica-y-metatranscriptomica" class="anchor-section" aria-label="Anchor link to header"></a></h3>
<p>En muchos casos nos interesa determinar la estructura de alguna comunidad biológica y estudiar su evolución en el tiempo, o simplemente comparar esa estructura en diferentes condiciones. Por ejemplo, la microbiota ruminal es fundamental para los procesos que determinan la degradación de la materia orgánica que el animal recibe, estando asociada también a qué productos de esta degradación recibirá el animal y en qué proporciones. ¿Qué variables afectan más la composición de la microbiota? ¿El pH ruminal? ¿El porcentaje de materia seca? ¿La proporción de fibra? En el plano de la salud, ¿qué microorganismos se encuentran presentes en la ubre sana y qué microorganismos en la glándula de un animal con mastitis? ¿La infección es a causa de un microorganismo dominante o el patógeno no precisa ser el que domine el ecosistema ruminal? ¿El rol del patógeno es directo sobre la salud del animal o su rol se limita a desestabilizar la ecología de la glándula?</p>
<p>Para poder responder a cualquiera de estas preguntas es necesario poder caracterizar la comunidad microbiana presente. A diferencia de lo que ocurre con especies de plantas, hongos y animales que generalmente podemos percibir y contar a simple vista, con los microorganismos nos ocurre que necesitamos identificarlos de formas más indirectas. Si bien usando el microscopio (con algo de suerte) podríamos ser capaces de reconocer el género de algunas bacterias presentes en una muestra, difícilmente seamos capaces de reconocer a la mayoría. Seríamos mucho menos capaces de reconocer las especies y cepas de estas bacterias, y muchísimo menos capaces de cuantificar la proporción de cada grupo bacteriano. Haciendo un paralelismo, para entender la comunidad vegetal de un bosque no alcanza con determinar la presencia de al menos un ejemplar de una especie: es fundamental entender la proporción que dicha especie ocupa en el ecosistema.</p>
<p>Como ya mencionamos, el hecho de que todos los organismos en nuestro planeta “desciendan” del mismo organismo ancestral, a veces conocido como <strong>LUCA</strong> (“<em>Last Unknown Common Ancestor</em>”, en inglés), nos sugiere que sería de esperar encontrar ciertas regularidades en la información genética de los mismos. Es decir, diferentes formas de vida son el producto de modificaciones a formas de vida preexistentes, al menos hasta llegar a <strong>LUCA</strong>, por lo que de alguna manera todos los seres vivos comparten ciertas características. Las diferencias entre especies, como sabemos, se corresponden en gran medida a cambios en el genoma de los mismos, tanto a nivel de mutaciones puntuales como de inserciones y deleciones, duplicaciones de regiones del genoma o aún re-arreglos cromosómicos. La clave para identificar especies es ubicar secuencias lo suficientemente conservadas como para que deban encontrarse en todos los organismos de interés, pero al mismo tiempo con suficientes cambios entre especies como para poder identificarlas en forma unívoca.</p>
<p>Dentro de las secuencias con estas características, la maquinaria vinculada a la traducción de la información es ciertamente privilegiada ya que constituye un elemento clave para cualquier forma de vida: la capacidad de traducir la información genética en los efectores, que suelen ser la proteínas. La traducción de la información implica una maquinaria tan compleja que resulta completamente implausible su surgimiento de forma independiente en diferentes linajes de la vida, más aún dado que cualquier especie ya hubiese precisado de una para existir. Además, debido a su enorme complejidad se trata de una maquinaria muy ajustada y donde es posible introducir muy pocas variaciones sin que la maquinaria deje de funcionar completamente, en particular porque el <strong><em>fitness</em></strong><a href="#fn7" class="footnote-ref" id="fnref7"><sup>7</sup></a> de los organismos tiene, en muchos casos, una vinculación directa con la tasa de producción de las proteínas. Un caso de particular importancia es el <strong>ARN ribosomal</strong> (<strong>ARNr</strong>). Este tipo de marcador molecular está constituido por una serie de moléculas de <strong>ARN</strong> que dependen de su estructura espacial para poder cumplir su rol. Esto incluye apareamientos Watson-Crick entre regiones complementarias, pero también bases modificadas post-transcripcionalmente para asegurar la estabilidad de la molécula y la fidelidad de la traducción.</p>
<p>En procariotas, el <strong>ARNr 16S</strong> es una molécula usada en forma extensiva para identificar el genero y especie de los organismos. De hecho, la propuesta para un sistema de clasificación de la vida de <span class="citation">Woese, Kandler, and Wheelis (<a href="#ref-WoeseKandlerWheelis1990">1990</a>)</span>, representada en la Figura <a href="intro.html#fig:arbolvida">1.1</a>, se basa en las diferencias observadas en la molécula de <strong>16S</strong> y su equivalente en eucariotas, el <strong>ARNr 18S</strong>. De acuerdo con esta forma de organizar las diferentes especies, existen tres grandes dominios de la vida: <em>Bacteria</em>, <em>Archaea</em> y <em>Eukarya</em>.<a href="#fn8" class="footnote-ref" id="fnref8"><sup>8</sup></a>. Es importante notar que a diferencia de la taxonomía basada en similitud morfológica, la clasificación propuesta por <span class="citation">Woese, Kandler, and Wheelis (<a href="#ref-WoeseKandlerWheelis1990">1990</a>)</span> se basa en similitud en las secuencias genómicas, donde de acuerdo a determinados modelos se pueden asignar relaciones de proximidad y distancia entre secuencias pertenecientes a diferentes organismos. En particular, la reconstrucción filogenética se realiza generalmente a partir de secuencias de genes <em>ortólogos</em><a href="#fn9" class="footnote-ref" id="fnref9"><sup>9</sup></a>, en este caso el <strong>ARN ribosomal 16S</strong>, por ejemplo. Si bien desde el punto de vista morfológico los miembros del dominio <strong>Archaea</strong> no son, aparentemente, muy distintos de los miembros de <strong>Bacteria</strong>, desde el punto de vista evolutivo poseen grandes diferencias que los hacen acreedores de su propio dominio.</p>
<div class="figure" style="text-align: center"><span style="display:block;" id="fig:arbolvida"></span>
<img src="figuras/PhylogeneticTreeWoese1990.png" alt="Árbol filogenético de los 3 dominios biológicos, Bacteria, Archaea y Eukarya. Con una barra vertical se representa la existencia de LUCA, el último ancestro común, desconocido. (Por Maulucioni - Trabajo Propio, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=24740337)." width="70%" />
<p class="caption">
Figura 1.1: Árbol filogenético de los 3 dominios biológicos, <em>Bacteria</em>, <em>Archaea</em> y <em>Eukarya</em>. Con una barra vertical se representa la existencia de <strong>LUCA</strong>, el último ancestro común, desconocido. (Por Maulucioni - Trabajo Propio, CC BY-SA 3.0, <a href="https://commons.wikimedia.org/w/index.php?curid=24740337">https://commons.wikimedia.org/w/index.php?curid=24740337</a>).
</p>
</div>
<p>Las técnicas de secuenciación masiva implicaron un salto enorme para la caracterízación de poblaciones microbianas, ya que permiten la secuenciación de miles y hasta millones de fragmentos de secuencias en muy poco tiempo y en forma paralela. La idea más básica consiste en secuenciar una determinada secuencia o región que se encuentre en todos los organismos de interés y que presente suficiente variabilidad, como es el caso del <strong>ARNr 16S</strong>. Esquemáticamente, los pasos serían los siguientes:</p>
<div class="recuadro">
<ol style="list-style-type: decimal">
<li>Determinar el grupo de organismos de interés, así como la molécula y región a secuenciar. Las regiones hipervariables <strong>V3</strong> y <strong>V4</strong> del <strong>ARNr 16S</strong> son buenas candidatas iniciales para procariotas. El gen tiene una longitud aproximada de 1.500 pb y contiene nueve regiones variables intercaladas entre regiones conservadas. Qué región del ARNr 16S secuenciar es un área de debate, y la misma puede variar dependiendo de cosas como los objetivos experimentales, el diseño y el tipo de muestra, aunque las regiones <strong>V3</strong> y <strong>V4</strong> son ampliamente utilizadas.</li>
<li>Extraer los ácidos nucleicos de interés y amplificar por PCR las regiones de interés. Los protocolos permiten en general utilizar “<em>barcodes</em>”, que son secuencias específicas que se agregan a las secuencias (un “<em>barcode</em>” para cada muestra), lo que permite correr en paralelo hasta 96 muestras en una misma “corrida” del secuenciador.</li>
<li>Secuenciar las muestras preparadas de acuerdo al protocolo. Existen diferentes tecnologías y en distintos tamaños, lo que permite secuenciar desde unas poquitas muestras hasta centenas de ellas a un costo razonable y en tiempos razonables. Las distintas tecnologías poseen problemas diferentes, pero en general no introducen sesgos importantes en la composición estimada de la muestra.</li>
<li>Control de calidad y limpieza de las secuencias obtenidas. Es una serie de procesos a nivel bioinformático que tienen por objetivo eliminar las secuencias de los adaptadores que se agregaron durante la preparación de las bibliotecas, separar las secuencias de acuerdo al correspondiente “<em>barcode</em>” y calcular una serie de parámetros que indican la calidad de la corrida y de cada una de las muestras.</li>
<li>Agrupamiento de secuencias y mapeo contra bases de datos con secuencias identificadas. Se trata del corazón de la idea y consiste en que cada secuencia o fragmento producido durante la secuenciación debe tener uno idéntico depositado en una base de datos con secuencias de organismos. Hay diferentes estrategias respecto a cómo agrupar los fragmentos antes de “mapearlos” contra las bases de datos y diferentes bases de datos de organismos, pero esto ya es materia específica de la bioinformática.</li>
<li>Una vez mapeadas las secuencias obtenidas, es decir que a cada una le asignamos un <strong>taxón</strong> determinado (puede llegar a ser una especie, aunque a veces la identificación queda a un nivel más alto, por ejemplo género), entonces alcanza con contar cuántas veces aparece cada organismo en una muestra (es decir, cuántos fragmentos secuenciados mapean al mismo taxón). Esto nos permite organizar la información en una tabla que puede tener las muestras en filas y los taxa en las columnas.</li>
<li>Análisis de la tabla de conteos. Por lo general la tabla generada de conteos tiene diferencias importantes en el número de secuencias obtenidas por muestra ya que no se obtiene la misma cantidad de ácidos nucléicos en cada muestra a pesar de los esfuerzos. Para la parte de exploración suelen usarse análisis exploratorios multivariados, como el <strong>escalado multidimensional</strong> (MDS), una técnica con cierta relación al PCA en su versión más clásica (que se conoce como <strong>Principal Coordinates Analysis</strong>, PCoA). La idea es reducir la dimensionalidad del problema de tal forma que se pueda representar en pocas dimensiones con poca pérdida de información. En el mejor de los casos, después es posible correlacionar directamente las posiciones de la muestras en las principales dimensiones con factores externos, tales como el pH, la temperatura, ubicación geográfica o cualquier otro factor que sea relevante. En la Figura <a href="intro.html#fig:mdslepto">1.2</a> se observa la representación gráfica de los dos primeros ejes en un análisis MDS realizado como control de calidad en un experimento de <strong>transcriptómica RNA-seq</strong> con <strong><em>Leptospira biflexa</em></strong>. Se observa que las muestras se agrupan de acuerdo a la condición biológica y que los dos factores relevantes desde el punto de vista biológico (fase de crecimiento y tiempo) son las que separan las muestras entre sí.</li>
</ol>
</div>
<div class="figure" style="text-align: center"><span style="display:block;" id="fig:mdslepto"></span>
<img src="figuras/mdslepto2016.jpg" alt="Escalado multidimensional en un experimento de transcriptómica de Leptospira biflexa. El experimento incluía dos factores, la fase de crecimiento (biofilm y planctónica) y dos tiempos (48 y 120 horas), en 3 réplicas (A, B y C) por condición. Alguna de las réplicas fue descartada por motivos de calidad (figura tomada de Iraola et al. (2016))." width="70%" />
<p class="caption">
Figura 1.2: Escalado multidimensional en un experimento de transcriptómica de <strong><em>Leptospira biflexa</em></strong>. El experimento incluía dos factores, la fase de crecimiento (biofilm y planctónica) y dos tiempos (48 y 120 horas), en 3 réplicas (A, B y C) por condición. Alguna de las réplicas fue descartada por motivos de calidad (figura tomada de <span class="citation">Iraola et al. (<a href="#ref-Iraolaetal2016">2016</a>)</span>).
</p>
</div>
<p>Con las tecnologías de segunda generación (Roche 454, Illumina, SOLiD) era y aún es común secuenciar fragmentos, como vimos recién. Sin embargo, con tecnologías de tercera generación como la de <strong>Oxford Nanopore Technologies</strong> es común secuenciar toda la molécula de <strong>16S</strong> ya que el largo de la lectura no está determinado <em>a priori</em> (como sí en Illumina) y es normal obtener <strong>reads</strong> (lecturas del secuenciador) de miles o aún decenas de miles de pares de bases. Por otro lado, existen otras formas de metagenómica que no pasan por la secuenciación de una región o de una secuencia en particular. En <strong>metagenómica funcional</strong> la idea es secuenciar todo el <strong>ADN</strong> presente en la muestra, en lugar de determinadas secuencias en particular. Esto permite capturar no solo la variabilidad de organismos presentes en la muestra sino que también identificar secuencias de ellos que puedan ser relevantes al problema biológico en cuestión.</p>
<p>Por ejemplo, si un determinado microorganismo se encuentra asociado a un determinado estado patológico de un sistema, conocer las secuencias de genes del mismo puede ser relevante para interpretar los mecanismos de acción del mismo. Asumiendo que el organismo no se encuentre completamente secuenciado y disponible en las bases de datos públicos, la función de las secuencias relevantes se puede deducir a partir del mapeo contra las bases de datos de secuencias anotadas (por ejemplo <strong>GenBank</strong>), usando <strong>BLAST</strong>. Por otro lado, si varios organismos están expresando las mismas vías, por ejemplo a causa del exceso de un determinado producto o metabolito en el medio, entonces aparecerá una plétora de secuencias relacionadas por la función, pero provenientes de diferentes organismos.</p>
<p>Un paso más adelante se encuentra la <strong>metatranscriptómica</strong> que tiene por objetivo la caracterización de todo el <strong>ARN</strong> mensajero (<strong>ARNm</strong>) presente en cada muestra. La diferencia más importante con la genómica funcional es que mientras que en esta última cada genoma aporta lo mismo y por lo tanto el factor de ponderación es la proporción de cada taxa (v.g. especie) en la muestra, en la metatranscriptómica existe la misma ponderación, pero también la ponderación por expresión de las secuencias (en realidad un balance entre la tasa de transcripción y la de decaimiento). De esta forma, más allá de identificar qué secuencias están presentes en la muestra, podemos cuantificar (en forma relativa) la “importancia” de cada una. Por ejemplo, en situaciones de organismos patógenos, si el mismo está expresando genes de resistencia a antibióticos, podemos identificar las secuencias responsables de esto a través de la <strong>metatranscriptómica</strong>.</p>
<p>Las aplicaciones de todas estas técnicas, <strong>metagenómica</strong>, <strong>metagenómica funcional</strong> y <strong>metatranscriptómica</strong> han permitido avanzar en varios campos donde entender el funcionamiento del ecosistema microbiológicos es fundamental. Por ejemplo, en agricultura resulta muy claro que desde el punto de vista de las plantas el suelo no es solamente el sustrato y las sustancias químicas disponibles para las mismas; se trata de un ecosistema complejo donde los microorganismos juegan un rol fundamental, tanto los de vida libre como los asociados a las plantas. En este sentido, resulta fundamental entender la diversidad de microorganismos en los distintos suelos, su evolución a lo largo del tiempo y cómo eso se relaciona con la productividad del suelo.</p>
<p>Ejemplos en el área de producción animal también son ubicuos. El rumen es un órgano complejo cuya principal misión consiste en la fermentación de los alimentos ingeridos y la preparación para la posterior absorción de nutrientes a nivel intestinal. Se trata de un ambiente esencialmente anaerobio (ausencia de oxígeno) donde proliferan múltiples microorganismos, entre los que se destacan bacterias, protozoos, arqueas metanogénicas, hongos y virus. La mayor parte de los microorganismos presentes nunca han sido cultivados, en parte por la dificultad de cultivar anaerobios, pero las técnicas de metagenómica han permitido enormes avances al respecto. Claramente, la microbiota ruminal es dinámica y suele verse afectada por diversos factores, que incluyen la dieta, cambios en la fisiología del animal producto de la preñez, cambios ambientales o la estación del año. Los distintos tipos de bacterias que actuan en el rumen (de acuerdo a su función en la digestión) comprenden las celulolíticas, lactolíticas, sacarolíticas, lipolíticas, amilolíticas y metanogénicas ureolíticas, entre otras. Entender cómo las distintas variables afectan la composición de la microbiota ruminal es esencial para predecir los impactos en la salud animal y en la producción.</p>
<p>En salud animal como en salud vegetal resulta fundamental entender cuáles son los patógenos causantes de una enfermedad. En general, muchos de los microoorganismos que se encuentran en el órgano afectado son desconocidos y en muchos casos no son cultivables. Como las condiciones de cultivo suelen ser fundamentales en la bacteriología clásica, existe un sesgo importante en asignar las causas de la patogenicidad a organismos cultivables. Esto nos deja con una parte de la historia conocida y otra parte (posiblemente igual de relevante) sin conocer, ya que en muchos casos el origen de una patología puede ser el producto de un desarreglo en la comunidad que lleve a patógenos oportunistas a tomar la oportunidad. Más aún, uno de los temas de mayor preocupación para la salud mundial, en el paradigma de <strong>Una Sola Salud</strong> (<strong><em>One Health</em></strong>, en inglés) es la resistencia a antibióticos que se ha desarrollado a escala global y que amenaza dejarnos sin tratamiento ante enfermedades que parecían superadas. Frente a esto parece fundamental empezar a trabajar el tema desde una perspectiva racional, tanto a nivel de las políticas y la investigación como a nivel del trabajo de campo. Para un manejo racional es fundamental, a su vez, conocer los organismos causantes de cada patología específica, así como los potenciales mecanismos de resistencia desarrollados, ya que el uso infructuoso de antibióticos no hace otra cosa que aumentar las posibilidades de desarrollar otras resistencias.</p>
<p>En este último sentido, la metagenómica puede constituirse en una herramienta muy poderosa para la invetigación, por ejemplo en el estudio de la mastitis bovina, analizando los cambios en la flora microbiana de la glándula mamaria en animales sanos cuando pasan a un estado de mastitis. En principio, no solo es posible estudiar la composición microbiana durante la evolución de la enfermedad sino que mediante <strong>metagenómica funcional</strong>, y especialmente mediante <strong>metatranscriptómica</strong>, se puede analizar el <strong>resistoma</strong> (el conjunto de los genes relacionados a la resistencia) de la ubre (<span class="citation">Hoque et al. (<a href="#ref-Hoqueetal2020">2020</a>)</span>). Además, otras técnicas masivas que ya se están utilizando en forma rutinaria en el diagnóstico de enfermedades infecciosas en humano, como la espectrometría de masas MALDI-TOF<a href="#fn10" class="footnote-ref" id="fnref10"><sup>10</sup></a>, prometen revolucionar la velocidad y precisión de diagnóstico en animales de producción, así como mejorar la predicción de resistencias antes de aplicar antibióticos (<span class="citation">Nonnemann et al. (<a href="#ref-Nonnemannetal2019">2019</a>)</span>).</p>
</div>
<div id="ejemplo-1.2" class="section level3 unnumbered hasAnchor">
<h3>Ejemplo 1.2<a href="intro.html#ejemplo-1.2" class="anchor-section" aria-label="Anchor link to header"></a></h3>
<p>Interpretar la Figura <a href="intro.html#fig:mdslepto">1.2</a> sabiendo que la letra inicial (“P” de planctónica, es decir vida libre, o “B” de biofilm) representa la fase del crecimiento de colonias de la bacteria <strong><em>Leptopsira interrogans</em></strong>, la segunda letra representa la réplica biológica del experimento (“A”, “B” o “C”, para tres réplicas) y los número finales representan las horas a las que se extrajo la muestra a partir del inicio del experimento.</p>
<p>En general, en todos los experimentos biológicos donde queremos generalizar las conclusiones a la población debemos incluir una muestra representativa de individuos a comparar. Los experimentos de transcriptómica son lo suficientemente complejos y caros como para que el número de réplicas no sea elevado (3 por condición, en este caso).</p>
<p>Originalmente se trata de un experimento factorial balanceado del tipos 2x2, ya que tenemos dos factores (la fase de crecimiento -vida libre o biofilm- y los tiempos -48 y 120 horas-), cada uno con dos niveles; en cada celda del diseño factorial tenemos 3 réplicas. Se trata de un experimento de RNA-seq (transcriptómica), por lo que los datos que originan el gráfico salen de una tabla de conteo de “<em>reads</em>”.</p>
<p>Lo primero que se observar en la figura es que algunas muestras fueron descartadas del análisis, de acuerdo con los autores debido a que no cumplían los requisitos de calidad previamente establecidos. Lo segundo que se observa es que las muestras se agrupan razonablemente de acuerdo a la condición biológica, es decir, cada celda del diseño factorial (que están representadas por distintos colores). Seguramente, las muestras no consideradas caerían lejos de su grupo correspondiente (lo que no es criterio para descartarlas), pero también lejos de de todas las otras muestras.</p>
<p>Finalmente, la distribución de las muestras no sigue el patrón de que cada celda del diseño factorial (cada color en el gráfico), ocupe un cuadrante diferente, en particular cada eje representando uno de los factores. Entonces, podemos deducir que la relación entre los factores y las fuentes de varianción no es totalmente ortogonal (<em>i.e.</em>, no son totalmente independientes). Sin embargo, es posible trazar una línea que divida a las de vida libre (planctónicas) de las sésiles (biofilm) y otra línea que separe las de 48 hs vs las de 120 horas (de hecho, infinitas de estas rectas en ambos casos), por lo que parece existir “buena biología” en las causas de la separación.</p>
<div class="graybox">
<div class="graybox-header">
<p><strong>PARA RECORDAR</strong></p>
</div>
<ul>
<li>Para entender la variabilidad genética es necesario conocer las secuencias, o al menos algunas secuencias que nos puedan servir de marcador, en muchos individuos. Los <strong><em>microarrays</em></strong> son un arreglo de <strong>sondas moleculares</strong> colocadas en una placa.</li>
<li>Una <strong>sonda molecular</strong>, en este caso, es una <strong>secuencia específica a un gen o una región de un gen y que es (idealmente) única en el genoma de referencia</strong>. Cuando el ADN o el ADN copia (en los estudios de transcriptómica) de un individuo se hibrida con dicha sonda (que está fijada en la placa) se produce algún tipo de señal, por ejemplo la emisión de luz en determinada frecuencia al ser iluminada por un laser. Esta tecnología permite, por ejemplo, identificar si la secuencia presente en el organismo es de un tipo u otro en el caso de los <strong>SNPs</strong> (polimor- fismos de un solo nucleótido) e identificar el genotipo en el caso de las especies diploides.</li>
<li>Es importante tener en cuenta que para crear una sonda para medir variabilidad hay que conocer de antemano las secuencias de regiones que contengan variabilidad, y que el <em>array</em> solo va a captar variabilidad en las posiciones del genoma para el que fue diseñado.</li>
<li>La <strong>metatranscriptómica</strong> tiene por objetivo la <strong>caracterización de todo el ARN mensajero (ARNm)</strong> presente en cada muestra. La diferencia más importante con la genómica funcional es que mientras que en esta última cada genoma aporta lo mismo y por lo tanto el factor de ponderación es la proporción de cada taxa (<em>v.g.</em>, especie) en la muestra, en la metatranscriptómica existe la misma ponderación, pero también la ponderación por expresión de las secuencias. De esta forma, más allá de identificar qué secuencias están presentes en la muestra, podemos cuantificar (en forma relativa) la “importancia” de cada una.</li>
</ul>
</div>
</div>
</div>
<div id="genómica-composicional" class="section level2 hasAnchor" number="1.2">
<h2><span class="header-section-number">1.2</span> Genómica composicional<a href="intro.html#genómica-composicional" class="anchor-section" aria-label="Anchor link to header"></a></h2>
<p>Si bien todos los organismos derivan del mismo organismo ancestral (<strong>LUCA</strong>) y por lo tanto deben compartir ciertas características en sus genomas, los mismos evolucionan y son la base de las diferencias entre los distintos organismos. A nivel genómico la evolución se da por un conjunto de eventos como las mutaciones puntuales, las duplicaciones de genes y regiones, o las inserciones y “deleciones” de secuencias nucleotídicas. Claramente, la mayor parte de estos eventos producen cambios importantes a nivel composicional de los genomas. Por ejemplo, las mutaciones pueden llevar a una acumulación de cambios completamente al azar en los genomas, o puede tener determinados tipos de sesgos que favorezcan que las mutaciones sean hacia determinadas bases (por ejemplo, mutaciones desde las bases A y T hacia las base G y C; recordar que en el ADN doble cadena A se aparea con T y C con G). Los eventos de duplicación génica, por otro lado, generan cierta libertad para que ambas evolucionen más libremente, ya que en principio una de las dos secuencias sigue siendo funcional (hasta que también deje de serlo) y de esta forma se pueden explorar nuevas funciones para una de las dos secuencias.</p>
<p>En general, el conjunto de estos cambios hace que resulte interesante para entender las bases de la evolución en ambientes particulares, o aún en general, el conocimiento de las secuencias de los diferentes organismos y la comparación de las mismas. El estudio de las variaciones en la composición de los genomas es lo que se puede llamar <strong><em>genómica composicional</em></strong> y forma parte de la <strong><em>genómica comparativa</em></strong>. A continuación veremos el tema de la variación en composición, tanto desde el punto de vista de los nucleótidos, como de los codones en las secuencias codificantes y finalmente de los aminoácidos que forman las proteínas.</p>
<div id="contenido-gc-genómico-génico-correlaciones-y-textgc_textskew" class="section level3 unnumbered hasAnchor">
<h3>Contenido GC genómico, génico, correlaciones y <span class="math inline">\(\text{GC}_{\text{skew}}\)</span><a href="intro.html#contenido-gc-genómico-génico-correlaciones-y-textgc_textskew" class="anchor-section" aria-label="Anchor link to header"></a></h3>
<p>La proporción de bases guanina y citosina (G y C, respectivamente) que
componen una secuencia se conoce como el contenido GC de la misma, o
G+C, o aún GC% (cuando expresado en porcentaje)<a href="#fn11" class="footnote-ref" id="fnref11"><sup>11</sup></a>. Por las reglas de
apareamiento de bases (A-T y G-C), no tiene importancia en la
determinación de dicho contenido cual hebra del ADN se considera para el
cálculo de esta proporción.</p>
<div class="recuadro">
<p><strong>Reglas de Chargaff</strong></p>
<ul>
<li><strong>Primera regla de paridad</strong>
La primera regla sostiene que una molécula de ADN de doble cadena tiene a nivel global las siguientes igualdades en el porcentaje de bases:%A=%T y %G=%C. La validación rigurosa de la norma constituye la base del apareamiento de Watson-Crick de la doble hélice del ADN.</li>
<li><strong>Segunda regla de paridad</strong>
La segunda regla es que tanto %A∼%T y %G∼%C son válidos para cada una de las dos hebras de ADN. Esto describe solamente una caracterísstica global de la composición de bases en una sola hebra de ADN.</li>
</ul>
</div>
<p>En principio, uno podría preguntarse cuál es
la importancia de medir esta proporción en particular y no otra de las
tres posibles combinaciones de dos bases distintas<a href="#fn12" class="footnote-ref" id="fnref12"><sup>12</sup></a>. Es
más, alguna de ellas resultan obviamente relevantes, como la proporción
de purinas vs. pirimidinas (AG vs. CT). Entonces, ¿qué es lo que hace
tan relevante al contenido GC de las secuencias?</p>
<div class="recuadro">
<p><strong>Transiciones y transversiones</strong></p>
<ul>
<li>Los cambios entre <strong>PURINAS</strong> (A y G) o entre <strong>PIRIMIDINAS</strong> (C y T) se llaman <strong>transiciones</strong>.</li>
<li>Los cambios de PURINAS a PRIDIMINAS, o al revés, se llaman <strong>transversiones</strong>.</li>
<li>Las transiciones son mucho más frecuentes que las transversiones.</li>
</ul>
</div>
<p>Existen varias razones, como veremos más adelante, pero desde el punto de vista bioquímico tal
vez la más obvia sea la diferencia en el número de puentes de hidrógeno
entre los apareamientos A-T y los G-C, dos para el primero y tres para
el segundo, así como diferencias en el “<em>stacking</em>” resultante<a href="#fn13" class="footnote-ref" id="fnref13"><sup>13</sup></a>. Esto
conduce directamente a importantes diferencias en las propiedades
físicas de la doble hebra. Por ejemplo, existe un incremento en el “<em>melting
point</em>” (temperatura en la cual la mitad de las dobles hélices de ADN se desnaturalizan) en función del contenido GC
<span class="citation">(<a href="#ref-Yakovchuk_Protozanova_Frank-Kamenetskii_2006">Yakovchuk, Protozanova, and Frank-Kamenetskii 2006</a>)</span>. Pero más importante
aún, en secuencias codificantes el código genético (tanto el “universal”
como todas sus variantes) establece un mapeo entre la secuencia de ADN y
la proteína que será traducida a partir de la misma. Dada la estructura
“redundante” del código genético, algunos aminoácidos presentan poca
dependencia del contenido GC, mientras que otros se encuentran
fuertemente asociados a este problema (ya que los codones
correspondientes tienen un sesgo importante).</p>
<p>En la Figura <a href="intro.html#fig:tabcodgene">1.3</a> se aprecia la tabla correspondiente al <strong>código genético universal</strong><a href="#fn14" class="footnote-ref" id="fnref14"><sup>14</sup></a>.</p>
<div class="figure" style="text-align: center"><span style="display:block;" id="fig:tabcodgene"></span>
<img src="figuras/tablacodigogeneticoWiki.jpg" alt="Tabla del código genético universal. En amarillo los aminoácidos apolares, en verdes los polares, azul básicos y rosa ácidos, con blanco correspondiendo a los codones de parada (de Wikipedia, https://es.wikipedia.org/wiki/Código_genético)." width="70%" />
<p class="caption">
Figura 1.3: Tabla del código genético universal. En amarillo los aminoácidos apolares, en verdes los polares, azul básicos y rosa ácidos, con blanco correspondiendo a los codones de parada (de Wikipedia, <a href="https://es.wikipedia.org/wiki/C%C3%B3digo_gen%C3%A9tico">https://es.wikipedia.org/wiki/Código_genético</a>).
</p>
</div>
<p>Claramente, de acuerdo a los colores, que representan propiedades de los aminoácidos, los mismos se encuentran distribuidos en forma bastante organizada de acuerdo a estas propiedades. Cada columna marca una base diferente en segunda posición del codón (U, C, A, G). Por ejemplo, la tercera columna incluye los codones con segunda base <strong>A</strong> (adenina) y la misma codifica para aminoácidos mayormente codificados por duetos (<em>i.e.</em>,por dos codones). La primera columna corresponde a codones con segunda base <strong>U</strong> (uracilo, correspondiente en ADN a <strong>T</strong>) y codifica para aminoácidos apolares.</p>
<div class="recuadro">
<p><strong>Alguna propiedades del código genético universal</strong></p>
<ul>
<li>2 Singletons (Met y Trp), 9 Duetos (Phe, Tyr, His, Gln, Asn, Lys, Asp,
Glu, Cys), 1 Terceto (Ile), 5 Cuartetos (Val, Pro, Thr, Ala, Gly) y
3 Sextetos (Leu, Ser, Arg).</li>
<li>La tercera columna (A en la segunda base) codifica duetos: 2/3 de los cambios en tercera base no son sinónimos.</li>
<li>La primera base del codón es muy conservada: un cambio de bloque-fila implica en general cambio de aminoácido, excepto en sextetos Arg y Leu.</li>
<li>La segunda base del codón es la más conservada: un cambio de columna implica un cambio de aminoácido.</li>
<li>La tercera base es la más neutra y por lo tanto menos conservada (rol de los cuartetos).
Los cambios de aminoácidos (de cuál a cuál) no son todos equivalentes en su impacto: hay cambios conservativos y otros disruptivos.</li>
</ul>
</div>
<p>Entre los aminoácidos codificados por codones con un fuerte sesgo GC(AT) tenemos: <strong><em>Phe</em></strong> (5 A/T en 6
posiciones), <strong><em>Ile</em></strong> (8 A/T en 9) y <strong><em>Tyr</em></strong> (5 A/T en 6). ¿Son utilizados estos aminoácidos de forma homogénea en los diferentes genes codificantes de los organismos?. Veamos por
ejemplo cómo es el uso de estos aminoácidos en el genoma de <em>Buchnera aphidicola str. Cc (Cinara cedri)</em>,
una bacteria parásita intracelular obligada con contenido GC de 20.1%.
Mientras que en la proteína codificada por la secuencia con mayor contenido GC del genoma (36.7%) el
uso de estos 3 aminoácidos corresponde al 16%, en la proteína con menor
contenido GC (8.6%) el uso de los mismos sube a 48%. Además, nos podemos preguntar, ¿las diferencias en contenido GC a nivel genómico pueden dar lugar a diferencias en el contenido GC de las secuencias codificantes?. ¿Esto puede llevar a diferencias entre organismos con genomas con contenido GC diferente?. En principio, podemos pensar que estas diferencias
no tendrían de por sí una consecuencia necesaria a nivel de diferencias
entre organismos, ya que de hecho el contenido GC podría ser una simple consecuencia de los aminoácidos constituyentes de las proteínas codificadas en el organismo y no al
revés. Es decir, la distribución del contenido GC de las proteínas de un
organismo podría ser solo el reflejo de la constitución de las mismas.</p>
<p>Sin embargo, de ser esto cierto esperaríamos que organismos con una
composición relativamente similar a nivel de sus proteínas
constituyentes tuvieran similar contenido GC, y esto no es lo que ocurre.
De hecho, es bien conocido que entre los organismos procariotas
(Bacteria y Archaea) el contenido GC genómico varía desde 25% a 75%
aproximadamente <span class="citation">(<a href="#ref-Sueoka_1962">Sueoka 1962</a>)</span>, con algunos organismos aún más extremos. Estas variaciones marcadas se dan incluso entre organismos de un mismo filo. Más aún, la
bacteria <em>Anaeromyxobacter dehalogenans 2CP-C</em>, primer cultivo puro de
una <em>myxobacteria</em> capaz de crecer en forma anaeróbica, con un contenido
GC genómico de 74.9%, está constituída por proteínas cuyo contenido GC
va entre 56.5% y 88.0%. Comparando esto con los datos de <em>B. aphidicola</em>
mencionados anteriormente, observamos que no existe superposición. Es decir, ambas bacterias no
tendrían ninguna proteína de similar composición. Sabemos, sin embargo,
que ambas comparten un origen evolutivo único, y por lo tanto descienden
de un mismo organismo. Además, ambas cuentan con una serie de proteínas
con idéntica función, pero de hecho con la composición aminoacídica de estas es muy
diferente. Claramente, estos hechos van en contra de la línea de razonamiento planteada anteriormente.<br />
</p>
<p>¿Qué es entonces lo que nos permite pensar que sería el contenido GC el
que conduce el proceso de sustitución de aminoácidos? Hay varios motivos
para pensar en este sentido. El primero es que los procariotas, cuyo
genoma es en su mayoría <strong>codificante</strong>, poseen una importante homogeneidad
composicional (restringida por la necesidad de usar todos los
aminoácidos). Esto se manifiesta aún en las regiones intergénicas, que
no tienen mayores restricciones composicionales. Un ejemplo del alto
nivel de homogeneidad se puede ver al comparar los intervalos
inter-cuartílicos de contenido GC codificante, que tanto en <em>B.
aphidicola</em> como en <em>A. dehalogenans</em> es de 6%; en otras palabras, la
mitad de las proteínas dentro de cada bacteria difieren en menos de 6%
de contenido GC (comparar contra más de 50% de diferencia entre el contenido GC del genoma de ellas).</p>
<p>Pero, además, existe otra evidencia fuerte. Así como calculamos el contenido GC de una
secuencia, también podemos calcular el contenido GC en cada una de las
posiciones de los codones de la misma. Como hay tres posiciones por
codón tenemos entonces <span class="math inline">\(GC_1\)</span>, <span class="math inline">\(GC_2\)</span> y <span class="math inline">\(GC_3\)</span>, de acuerdo al contenido
GC solo considerando una posición a la vez. Si observamos el código
genético con detenimiento vamos a observar que la tercera posición es la
“más sinónima”, es decir, la posición en la que una mayor proporción de
los cambios de base no afectan el aminoácido codificado. De hecho,
excepto <strong><em>Met</em></strong> y <strong><em>Trp</em></strong>, todos los aminoácidos poseen codones
sinónimos, con opción entre G/C y A/T. De acuerdo con esto, si el
contenido GC no estuviera conduciendo el proceso de sustitución de
aminoácidos, se podría esperar que el <span class="math inline">\(GC_3\)</span> se mantuviera variando
libremente entre los distintos genomas, con casi tanta varianza entre
como dentro de genomas. Sin embargo esto no es así, ya que existe una
fuerte correlación positiva entre el contenido GC y el <span class="math inline">\(GC_3\)</span>, tanto a
nivel de secuencias como considerando los genomas enteros (en
procariotas) y aún con las regiones intergénicas flanqueantes
<span class="citation">(<a href="#ref-Zerial_Salinas_Filipski_Bernardi_1986">Zerial et al. 1986</a>)</span>.<br />
</p>
<p>Además de los sesgos en contenido GC que discutimos más arriba, existen
otros sesgos menos obvios pero con muy importantes consecuencias
prácticas. Por ejemplo, si consideramos una región particular de la
mayoría de los genomas bacterianos es posible observar una diferencia
importante (dentro de cada hebra) entre el número de bases G y C, así
como entre A y T. De hecho, este fenómeno se encuentra asociado a la
replicación de los genomas bacterianos (usualmente circulares) y
típicamente la hebra “<em>leading</em>” (“líder”, en inglés) se encuentra enriquecida en G y T,
mientras que la “<em>lagging</em>” (“rezagada”, en inglés) se encuentra enriquecida en C y A. Las
desviaciones de las frecuencias G=C y A=T se conocen como <span class="math inline">\(\text{GC}*{\text{skew}}\)</span> y
<span class="math inline">\(\text{AT}*{\text{skew}}\)</span>, respectivamente <a href="#fn15" class="footnote-ref" id="fnref15"><sup>15</sup></a>. Una aplicación práctica evidente de
esto es la determinación (aproximada) del origen de replicación, ya que
en este (y en la posición opuesta dentro del genoma circular) habrá un
cambio de signo del <span class="math inline">\(\text{GC}*{\text{skew}}\)</span> (asociado a la densidad de genes en una
hebra y otra). Una forma de visualizar esto es graficando el <span class="math inline">\(\text{GC}*{\text{skew}}\)</span>
en las ordenadas contra la posición del genoma (centro de la ventana) a
partir del cual fue calculado, identificando el cambio de signo en las
ordenadas. Otra alternativa, generalmente más efectiva, es plotear el
<span class="math inline">\(\text{GC}_{\text{skew}}\)</span> acumulado contra la posición y observar los máximos y mínimos
del gráfico, que usualmente están a una distancia de medio genoma
<span class="citation">(<a href="#ref-Grigoriev_1998">Grigoriev 1998</a>)</span>.</p>
<p>Si bien existe una fuerte controversia sobre la explicación causal de
todas estas correlaciones, así como de correlaciones entre el contenido
GC y factores del ambiente donde viven los organismos, resulta claro que el contenido GC
tiene un importante rol en la evolución de los organismos y en los
procesos moleculares que rigen a los mismos (incluso se debe tener en
cuenta a la hora de calcular algunos índices genómicos o en los procesos
bioquímicos que requieran la denaturalización del ADN). Existen diversas
herramientas para el cálculo del contenido GC, alguna de ellas web
(<em><a href="http://v.gr/">v.gr</a>.</em>, Mobyle <a href="http://mobyle.pasteur.fr/">http://mobyle.pasteur.fr/</a>) que sirven para un cálculo
rápido de una o pocas secuencias. Sin embargo, si el cálculo involucra
muchas secuencias lo usual es recurrir a la programación de tipo
“<em>scripting</em>”, usualmente en lenguajes como <em>Python</em>
(<a href="http://python.org/">http://python.org/</a>), <em>Perl</em> (<a href="http://www.perl.org/">http://www.perl.org/</a>), o <em>Java</em>
(<a href="http://www.java.com/">http://www.java.com</a>; todos ellos poseen módulos “Bio” que facilitan
todas las tareas), en <em>R</em> (<a href="http://cran.r-project.org/">http://cran.r-project.org/</a>) a través de
bibliotecas como <em>seqinr</em>, en bash (cuando se trabaja en Linux-UNIX o
Mac OS-X), o usando paquetes como <em>EMBOSS</em>
(<a href="http://emboss.sourceforge.net/">http://emboss.sourceforge.net/</a>). Si se desea trabajar con genomas
procariotas ya secuenciados, una página interesante es la de OligoWeb
(<a href="http://insilico.ehu.es/oligoweb/">http://insilico.ehu.es/oligoweb/</a>), ya que además de las frecuencias de
nucleótidos de los distintos genomas ya tiene calculados otros índices y
estadísticos.<br />
</p>
</div>
<div id="uso-de-codones" class="section level3 unnumbered hasAnchor">
<h3>Uso de codones<a href="intro.html#uso-de-codones" class="anchor-section" aria-label="Anchor link to header"></a></h3>
<p>Habíamos hablado antes de que los genomas procariotas eran
extremadamente amplios en el rango de contenidos G+C y que, dado lo
reducido de lo no-codificante, estas variaciones debían tener
implicancias en el uso de codones. Es más, si comparamos entre genomas
veremos que existe una clara correlación lineal entre el contenido GC
del genoma con <span class="math inline">\(GC_1\)</span>, <span class="math inline">\(GC_2\)</span> y <span class="math inline">\(GC_3\)</span>, aunque con diferentes
pendientes. En general <span class="math inline">\(GC_3\)</span> es una posición sinónima, es decir al cambiar
de base en ella no hay cambio de aminoácido (debido a la degeneración
del código genético; ver los cuartetos por ejemplo). <span class="math inline">\(GC_1\)</span> y <span class="math inline">\(GC_2\)</span> son mucho
más restringidas en su variación, dado que suelen implicar un cambio de
aminoácido, lo que por lo general afecta negativamente la función de la proteína donde sucede dicho cambio.</p>
<p>Esta redundancia en el código genético, sumado a las posibilidades de
reconocimiento alternativo codón/anticodón (no-Watson-Crick), permiten la
evolución en los genomas de diferentes estrategias de uso de codones
(UC) <span class="citation">(<a href="#ref-Rocha_2004">Eduardo P. C. Rocha 2004</a>)</span>. Esto, que puede verse entre genomas, también tiene su
correlato a nivel interno en muchos genomas. Es conocido que en algunos
genomas procariotas los genes altamente expresados tienden a usar
<strong>codones mayores</strong>, que suelen ser reconocidos en forma de apareamiento Watson-Crick por los tRNAs más abundantes, aunque hay distintos modelos (ver la discusión en
<span class="citation">(<a href="#ref-Rocha_2004">Eduardo P. C. Rocha 2004</a>)</span>). Lograr comprender los factores que inciden en el uso de
codones (también puede pensarse para aminoácidos) suele requerir de
alguna forma de “resumir” la información.<br />
</p>
<p>En un genoma procariota promedio tenemos unos 4000 genes y los codones
de aminoácidos con degeneración son 59 (los 64 menos los 3 <em>stop</em>, menos
<strong><em>Met</em></strong> y <strong><em>Trp</em></strong>, que son codificados por un único codón cada uno), lo que se puede resumir en una tabla de esas
dimensiones. Utilizando la misma, podríamos analizar si distintos genes utilizan de forma diferente los codones, e hipotetizar cuál puede ser el motivo subyacente a este fenómeno. Para quitar la influencia
del uso de aminoácidos como factor que influye en esta perspectiva (cada
proteína tiene un uso diferencial de AAs), se puede estandarizar a la
interna de cada aminoácido. Una de las estandarizaciones posibles es el
<em>RSCU</em> <span class="citation">(<a href="#ref-Sharp_Tuohy_Mosurski_1986">Sharp, Tuohy, and Mosurski 1986</a>)</span>, en el que el número observado de
codones para un aminoácido es dividido por el número esperado si el uso
dentro de un aminoácido fuera equiprobable. Es decir,</p>
<p><span class="math display" id="eq:rscu1">\[\begin{equation}
\text{RSCU}*{ij}=\frac{x*{ij}}{\frac{1}{n_i}\sum_{j=1}^{n_i}\ x_{ij}}
\tag{1.7}
\end{equation}\]</span></p>
<p>donde <span class="math inline">\(x_{ij}\)</span> es el número de ocurrencias del codón <span class="math inline">\(j\)</span> para el
aminoácido <span class="math inline">\(i\)</span> y <span class="math inline">\(n_i\)</span> es la multiplicidad del aminoácido <span class="math inline">\(i\)</span> (es decir, el número de codones que lo codifican).</p>
<p>De cualquier forma, aún luego de estandarizar seguimos teniendo la tabla
de 4000x59 (<em>i.e.</em> cada gen en una fila, y el índice RSCU calculado para cada uno de los 59 codones considerados). La mayor parte de los humanos tenemos una limitada capacidad
para visualizar datos en espacios de más de 3 dimensiones, por lo que
necesitamos reducir la “dimensionalidad” del problema. Podríamos pensar
en representar las 59 variables originales de a pares
(<span class="math inline">\(\binom{59}{2}=59*58/2=1711\)</span>), o aún de a tres
(<span class="math inline">\(\binom{59}{3}=59*58*57/6=32509\)</span>) para ver interacciones entre más
variables, pero estos números hacen imposible poder extraer conclusiones
relevantes en forma sistemática. Afortunadamente, existen diferentes técnicas
estadísticas exploratorias multivariadas que nos permiten abordar este
tipo de cuestiones.</p>
<p>Probablemente, de las técnicas usuales de análisis exploratorio multivariado, la más conocidas es el <strong>Análisis de Componentes Principales</strong> (PCA, del inglés <em>Principal Component Analysis</em>), aunque existen otros miembros prominentes
de la familia. Uno de los más interesantes para nuestro tipo de problema
es el <strong>Análisis de Correspondencia</strong> (COA, ver Sección <a href="intro.html#exploracion-multivariada">Exploración multivariada: Análisis de Correspondencia</a>). El mismo
nos permite reducir la variación en las 59 variables originales a unas
pocas dimensiones (cada una de ellas una combinación de las originales) que capturan la mayor parte de la variabilidad. De esta forma, el
problema pasa a ser identificar qué variables biológicas se asocian a
cada una de estas dimensiones.</p>
<p>Ejemplos típicos de variables biológicas
asociadas a la variación en el <strong>uso de codones</strong> dentro de genomas procariotas son el
<strong>contenido GC del gen</strong>, su <strong>nivel de expresión</strong>, la <strong>hidropatía</strong> promedio de
la proteína, la <strong>hebra</strong> en que se encuentra el gen, el <span class="math inline">\(\text{GC}_{\text{skew}}\)</span> y la
<strong>precisión en la traducción</strong> <span class="citation">(<a href="#ref-Ermolaeva_2001">Ermolaeva 2001</a>)</span>. Diferencias en el uso de codones entre
genomas han sido reportadas asociadas a varios factores
eco-fisiológicos, entre ellos la <strong>temperatura óptima de crecimiento</strong> y
adaptaciones a hiper-salinidad. Un programa diseñado específicamente
para el análisis composicional es el <em>codonW</em>
(<a href="http://codonw.sourceforge.net/">http://codonw.sourceforge.net/</a>), que analiza las frecuencias de
bases, codones y aminoácidos, calcula diferentes índices estadísticos,
así como permite realizar un COA en codones y AAs.</p>
<p>Existen diversos índices, calculados a partir de las frecuencias de
codones, que permiten identificar sesgos importantes en UC, que pueden
ser suficientemente indicativos de por sí, o combinados con la
información del COA. Por ejemplo, el <em>Nc</em> (número efectivo de codones)
es un índice del uso de codones intragénico. Puede tomar valores
extremos de 20, cuando un solo codón por aminoácido es utilizado en ese gen, a
61, cuando hay una equi-distribución de los mismos <span class="citation">(<a href="#ref-Wright_1990">F. Wright 1990</a>)</span>. Este
índice es sensible al contenido GC del genoma, y una mejora fue sugerida
posteriormente que toma en cuenta este factor <span class="citation">(<a href="#ref-Novembre_2002">Novembre 2002</a>)</span>. Otros
dos índices, “codon bias index” (<em>CBI</em>) y “frequency of optimal codons”
(<em>Fop</em>), calculan el sesgo a partir de un juego de codones “óptimos”,
derivados respectivamente de un conjunto particular de genes o de la
concentración de los tRNAs. Una aproximación totalmente diferente, que
no depende de un conjunto particular de genes, es el “Codon Adaptation
Index” (<em>CAI</em>)<span class="citation">(<a href="#ref-Sharp_Li_1987">Sharp and Li 1987</a>)</span>, que ha demostrado ser un indicador muy
razonable del nivel de expresión de los genes (basado en comparaciones
con técnicas para medir experimentalmente la expresión génica, como los
<em>microarrays</em>). El <em>CAI</em> es simplemente la media geométrica de los
<em>RSCU</em> relativos (al máximo <em>RSCU</em> para ese AA) de todos los codones de
una proteína. Con la misma notación que más arriba, si consideramos
<span class="math inline">\(\text{w}*{ij}=RSCU*{ij}/RSCU_{i,max}\)</span>, entonces se define
<span class="math inline">\(\text{CAI}=\exp({\frac{1}{L}\sum_{k=1}^L\ln \text{w}_{ij}})\)</span>.</p>
<p>Pese a los buenos
resultados del <em>CAI</em>, el mismo presenta también importantes debilidades,
como la no-linealidad y una sobre-estimación de las desviaciones para
secuencias cortas. En el 2009, Roymondal y colaboradores
<span class="citation">(<a href="#ref-Roymondal_Das_Sahoo_2009">Roymondal, Das, and Sahoo 2009</a>)</span> proponen una aproximación muy diferente,
basada en las frecuencias de cada base en las distintas posiciones de
los codones, que lleva al índice <em>RCB</em>. Estos autores proponen para cada
codón <em>xyz</em> calcular el <span class="math inline">\(\text{RCB}\)</span> de acuerdo a la fórmula:</p>