Projekt Zbirke gena sisara (MGC) Nacionalnog instituta za zdravlje (SAD) osmišljen je za generiranje i sekvenciranje javno dostupnog izvora cDNK koji sadrži potpuni otvoreni okvir čitanja (ORF) za svaki gen čovjeka i miša. Projekt je u početku koristio slučajnu strategiju za odabir klonova iz velikog broja biblioteka cDNK iz različitih tkiva. Klonovi kandidati izabrani su na osnovu 5'-EST sekvenci, a zatim su potpuno sekvencirani do velike tačnosti i analizirani algoritmima razvijenim za ovaj projekt. Sada je više od 11.000 ljudskih i mišjih 10.000 gena zastupljeno u MGC-u, s najmanje jednim klonom s punim ORF-om.
Pristup nasumičnom izboru sada dostiže točku zasićenja, a prijelaz na protokole usmjerene na transkripte koji nedostaju sada je potreban za kompletiranje mišjih i ljudskih zbirki. Usporedba sekvence MGC klonova s referentnim sekvencama genoma otkriva da je većina klonova cDNK vrlo visokog kvaliteta sekvence, iako je vjerojatno da neke cDNK mogu nositi pogrešne varijante kao posljedicu eksperimentalnih artefakata, kao što su PCR, kloniranje ili greške reverzne transkriptaze. Nedavno je projektu dodana komponenta cDNK pacova, a tekući projekti cDNK žabe (Xenopus) i zebrice (Danio) prošireni su kako bi se iskoristili prednosti visokopropusnog MGC kanala.[7]
^Daniela S Gerhard, Lukas Wagner, Elise A Feingold, Carolyn M Shenmen, Lynette H Grouse, Greg Schuler, Steven L Klein, Susan Old, Rebekah Rasooly, Peter Good, Mark Guyer, Allison M Peck, Jeffery G Derge, David Lipman, Francis S Collins, Wonhee Jang, Steven Sherry, Mike Feolo, Leonie Misquitta, Eduardo Lee, Kirill Rotmistrovsky, Susan F Greenhut, Carl F Schaefer, Kenneth Buetow, Tom I Bonner, David Haussler, Jim Kent, Mark Kiekhaus, Terry Furey, Michael Brent, Christa Prange, Kirsten Schreiber, Nicole Shapiro, Narayan K Bhat, Ralph F Hopkins, Florence Hsie, Tom Driscoll, M Bento Soares, Tom L Casavant, Todd E Scheetz, Michael J Brown-stein, Ted B Usdin, Shiraki Toshiyuki, Piero Carninci, Yulan Piao, Dawood B Dudekula, Minoru S H Ko, Koichi Kawakami, Yutaka Suzuki, Sumio Sugano, C E Gruber, M R Smith, Blake Simmons, Troy Moore, Richard Waterman, Stephen L Johnson, Yijun Ruan, Chia Lin Wei, S Mathavan, Preethi H Gunaratne, Jiaqian Wu, Angela M Garcia, Stephen W Hulyk, Edwin Fuh, Ye Yuan, Anna Sneed, Carla Kowis, Anne Hodgson, Donna M Muzny, John McPherson, Richard A Gibbs, Jessica Fahey, Erin Helton, Mark Ketteman, Anuradha Madan, Stephanie Rodrigues, Amy Sanchez, Michelle Whiting, Anup Madari, Alice C Young, Keith D Wetherby, Steven J Granite, Peggy N Kwong, Charles P Brinkley, Russell L Pearson, Gerard G Bouffard, Robert W Blakesly, Eric D Green, Mark C Dickson, Alex C Rodriguez, Jane Grimwood, Jeremy Schmutz, Richard M Myers, Yaron S N Butterfield, Malachi Griffith, Obi L Griffith, Martin I Krzywinski, Nancy Liao, Ryan Morin, Diana Palmquist, Anca S Petrescu, Ursula Skalska, Duane E Smailus, Jeff M Stott, Angelique Schnerch, Jacqueline E Schein, Steven J M Jones, Robert A Holt, Agnes Baross, Marco A Marra, Sandra Clifton, Kathryn A Makowski, Stephanie Bosak, Joel Malek (2006): The status, quality, and expansion of the NIH full-length cDNA project: the Mammalian Gene Collection (MGC). Genome Res. 16(6):804pmcid: pmc528928; doi: 10.1101/gr.2596504