(12) Patent Application Publication (10) Pub. No.: US 2014/0186843 A1 ZHANG Et Al

US 2014O186843A1 (19) United States (12) Patent Application Publication (10) Pub. No.: US 2014/0186843 A1 ZHANG et al. (43) Pub. Date: Jul. 3, 2014 (54) METHODS, SYSTEMS, AND APPARATUS FOR (22) Filed: Dec. 12, 2013 IDENTIFYING TARGET SEQUENCES FOR CAS ENZYMES OR CRISPR-CAS SYSTEMIS Related U.S. Application Data FORTARGET SEQUENCES AND (60) Provisional application No. 61/736,527, filed on Dec. CONVEYING RESULTS THEREOF 12, 2012, provisional application No. 61/748,427, filed on Jan. 2, 2013, provisional application No. (71) Applicants: Massachusetts Institute of Technology, 61/791,409, filed on Mar. 15, 2013, provisional appli Cambridge, MA (US): THE BROAD cation No. 61/835,931, filed on Jun. 17, 2013. INSTITUTE, INC., Cambridge, MA (US) Publication Classification (72) Inventors: Feng ZHANG, Cambridge, MA (US); (51) Int. C. Naomi HABIB, Cambridge, MA (US) CI2O I/68 (2006.01) (52) U.S. C. (73) Assignees: Massachusetts Institute of Technology, CPC ...................................... CI2O I/686 (2013.01) Cambridge, MA (US): THE BROAD USPC ....................................... 435/6.12: 435/287.2 INSTITUTE, INC., Cambridge, MA (US) (57) ABSTRACT Disclosed are locational or positional methods concerning (21) Appl. No.: 14/104,900 CRISPR-Cas systems, and apparatus therefor. Patent Application Publication Jul. 3, 2014 Sheet 1 of 50 US 2014/O186843 A1 s g:23:3:3: 83: FIG. 1 Patent Application Publication Jul. 3, 2014 Sheet 2 of 50 US 2014/O186843 A1 §§§§ §§§§§§ Patent Application Publication Jul. 3, 2014 Sheet 3 of 50 US 2014/O186843 A1 NLs SpCass GFP SpCass GFP NS NLS Spass GFP LS 8 N.S. tery RNase Sp RNase is Cerry NS FG. 2B Patent Application Publication Jul. 3, 2014 Sheet 4 of 50 US 2014/O186843 A1 OZ"SO|- O Patent Application Publication Jul. 3, 2014 Sheet 5 of 50 US 2014/O186843 A1 D 2xNS-SpCass SpRNAse I - Sir tracNA * DR-EVX-DR + - : 684p b 367ap b 37ap b inde (%. 3. 3. FG. 2D Patent Application Publication Jul. 3, 2014 Sheet 6 of 50 US 2014/O186843 A1 ,§.*???3.333$. ,5-,9,999\,993 ? Patent Application Publication Jul. 3, 2014 Sheet 7 of 50 US 2014/O186843 A1 Emx target Target DNA 5'- G F C A C C T C C A A T G A C F A G G G T G G-3' clearage efficiency is Enx target 2 P Target DNA 5'- G - G - C A C E G G : ; G A E G T G A T G G S-3' cleavage efficiency Ei FIG. 3 Patent Application Publication Jul. 3, 2014 Sheet 8 of 50 US 2014/O186843 A1 cleavage efficiency FIG. 4 Patent Application Publication Jul. 3, 2014 Sheet 9 of 50 US 2014/O186843 A1 it is: $88.888.58: & & 8 : 3. 8 - & 3. S: :: M3. 8a. wax, 8 8 g 8 8 8 3. g :: y 33. 8. 3. 8 $8. f 38 y 8.833.3388: FIG. 5 Patent Application Publication Jul. 3, 2014 Sheet 10 of 50 US 2014/O186843 A1 x S 3- R3 g'wesia;:g 8: 8:38S:38 2. 2. --- s 3 8 -as... as : X 88ss x38. & f saw se A.wi. cista:ce {:}} x o' *:R38&i-everagping is waitias at 8Xxx. $8 3. sista:8ce {{p} FIG. 6A Patent Application Publication Jul. 3, 2014 Sheet 11 of 50 US 2014/O186843 A1 x : *:RG ow8:3ppig 5 prise bin wai38s at 2 w 8. 83 & 3. disia::ce {33} x is 833 38-3yeriapping is waities.;at 3 8.3. 2 8. 8.3. Patent Application Publication Jul. 3, 2014 Sheet 12 of 50 US 2014/O186843 A1 883 overiappig 5 psite 8; waii;&sia: f 3 w 3. 3. 8. 3. sista::ce 3g: 33 *383 overiappig i3 waitias.at 8 3.& 2 m : s 33 3istance {{{3} FIG. 6C Patent Application Publication Jul. 3, 2014 Sheet 13 of 50 US 2014/O186843 A1 FG. 7A Patent Application Publication Jul. 3, 2014 Sheet 14 of 50 US 2014/O186843 A1 FG. 7B Patent Application Publication Jul. 3, 2014 Sheet 15 of 50 US 2014/O186843 A1 &&&&&&&&&& FG. 7C Patent Application Publication Jul. 3, 2014 Sheet 16 of 50 US 2014/O186843 A1 i8:::::::::::::: 3:. FG. 7 D Patent Application Publication Jul. 3, 2014 Sheet 17 of 50 US 2014/O186843 A1 %338 ::::::::::*******&#3 88: s •,,,,,,******* ***************** Patent Application Publication Jul. 3, 2014 Sheet 19 of 50 US 2014/O186843 A1 $$$$ $$$$$$$$% $$$$$$$$$ :::::::::: 3. Patent Application Publication Jul. 3, 2014 Sheet 20 of 50 US 2014/O186843 A1 O CO CD ill $$$$$ §§§§ ******* ::::::::::::: ?? w XY. &-- - - - - - - - - - - ww.w3.o.w.. www.w. ....wa.-- Patent Application Publication Jul. 3, 2014 Sheet 21 of 50 US 2014/O186843 A1 ¿************** Patent Application Publication Jul. 3, 2014 Sheet 22 of 50 US 2014/O186843 A1 ******** ********* §$% :::::::::::: &&&&&&&&&& &&&&&&&&&&&&&& ·;&**********- Patent Application Publication Jul. 3, 2014 Sheet 23 of 50 US 2014/O186843 A1 & 8388 3.88: s: 3. 3. 838: 8. s FIG. 9 Patent Application Publication Jul. 3, 2014 Sheet 24 of 50 US 2014/O186843 A1 FIG. 10 Patent Application Publication Jul. 3, 2014 Sheet 25 of 50 US 2014/O186843 A1 FIG. 11 Patent Application Publication Jul. 3, 2014 Sheet 26 of 50 US 2014/O186843 A1 :::::::: 88:8 &#33333338 FIG. 12 Patent Application Publication Jul. 3, 2014 Sheet 27 of 50 US 2014/0186843 A1 a -----------------a-3 & Patent Application Publication Jul. 3, 2014 Sheet 28 of 50 US 2014/O186843 A1 Patent Application Publication Jul. 3, 2014 Sheet 29 of 50 US 2014/O186843 A1 Scier Browser Human Feb. 2009 Grch37thg19) Assembly 32X8:::::: - &:28838:SMR v R.3 3:::::38 *:3: 8:3.3: 8.6's. 8: six-s:::::::::: R &&. s:x: rise:8:8; 3.x:8: W w r:::: s 8. se::::::: exa: &scasts s::s s: FIG. 15 Patent Application Publica ion Jul 3 9 2014. Sheet 30 Of 50 US 2014/O186843 A1 Patent Application Publica ion Jul 3 9 2014. Sheet 31 Of 50 US 2014/O186843 A1 &&&&&&&&&&&&&&&&&&&&&&&&&&&&&&& Patent Application Publ ication Jul 3 9 2014. Sheet 32 Of 50 US 2014/O186843 A1 |###*** ******* ? Patent Application Publ ication Jul 3 9 2014. Sheet 33 Of 50 US 2014/O186843 A1 Patent Application Publicat O Jul 3 9 2014. Sheet 34. Of 50 US 2014/O186843 A1 $$$$$ OZ"SO|- Patent Application Publ ication Jul 3 9 2014. Sheet 35 of 50 US 2014/O186843 A1 Patent Application Publica ion Jul 3 9 2014. Sheet 36 of 50 US 2014/O186843 A1 Patent Application Publication Jul. 3, 2014 Sheet 37 of 50 US 2014/O186843 A1 resex ce: CRSR resign feix ot 3:38 : axe:a::::::::::::::::::::::8:xxxx: '-'-'...'...''' xxx s X g &:888. FIG. 23 Patent Application Publication Jul. 3, 2014 Sheet 38 of 50 US 2014/O186843 A1 se: 83S E. 3 * ses ge 333; F. -----------------------------------------------> - sks: : -- 3 s: is aer.---- sg38A scaÉck: . * - EEEEEEEEE 33. & E. :3-&888, PS 33; 8:3: Six: gate liga Eois S- X- 3:3:38:3-3 gage::g a Sertici site ; : it is , ; : Chi FE A83. If S S Casig Ai SixGHA : *x X3. f Patent Application Publication Jul. 3, 2014 Sheet 39 of 50 US 2014/O186843 A1 s s: & x s : 8. &s 38 & Patent Application Publication Jul. 3, 2014 Sheet 40 of 50 US 2014/0186843 A1 --------- ---. ----as-a- **********::::::::::::::::: Patent Application Publication Jul. 3, 2014 Sheet 41 of 50 US 2014/O186843 A1 38 FIG. 27 Patent Application Publication Jul. 3, 2014 Sheet 43 of 50 US 2014/0186843 A1 {S C C J C C C C A S&Xi sigt & guide b6gue; cf. ... ifde; r - 3888 ) 2. - s targ of-target ocus FIG. 29 Patent Application Publication Jul. 3, 2014 Sheet 44 of 50 US 2014/O186843 A1 Spearman correlation coefficient: 0.58 O S O 5 20 25 30 35 40 Predicted cleavage (rank) FIG. 3O Patent Application Publication Jul. 3, 2014 Sheet 45 of 50 US 2014/O186843 A1 A8 testig. 8:8;&RR Patent Application Publication Jul. 3, 2014 Sheet 46 of 50 US 2014/O186843 A1 Input genome or DNA sequence S1 OO v Select CRISPR motif S1 O2 . Define. DNA. fragment. of. Yor fixed length before the selected CRISPR motif which is to occur in the sequence before the selected motif Scan input sequence to identify all target sites which include the Selected motifs and defined fragments S106 Filter identified target sites based on number of times each appears in target genome or target DNA library Select unique target site S1 10 Patent Application Publication Jul. 3, 2014 Sheet 47 of 50 US 2014/O186843 A1 Patent Application Publication Jul. 3, 2014 Sheet 48 of 50 US 2014/O186843 A1 Define thermodynamic model having a set of weights linking effective free energy of hybridization Z to local free energies G -Define a training Yset - of guide-RNA target-DNA sequence pairs Input known values of G for each guide-RNA? target-DNA sequence pair in the training set S2O4. v Calculate value of Z for each guide-RNA/target DNA sequence pair in the training set S2O6 w (Optional) Normalize calculated values of Z S208 ------------------------------------------------------------------------------------------------------------------------------------------------------------------- (Optional) Fitter out values of Z having less than a minimum sequencing depth S210 Determine the position-weights using a machine learning algorithm Output weights (including determining of G-values for the testing set of guide-RNA target-DNA sequence-pairs and using these as well as the position-weights to output new values of Z for the testing-set) S214 FG. 33B Patent Application Publication Jul. 3, 2014 Sheet 49 of 50 US 2014/O186843 A1 input genome or DNA sequence S300 Locate a mismatch between a target sequence of the input sequence and the guide RNA of a particular CaS enzyme ----------------------------------------------------------------------------------------------Determine average cutting frequency at the particular position for the mismatch Determine average cutting frequency for the particular mismatch type of the mismatch S306 Create a product by multiplying together the determined average Cutting frequencies S308 O - is there s s - another mismatch?) S.

(12) Patent Application Publication (10) Pub. No.: US 2014/0186843 A1 ZHANG Et Al

Database of Cattle Candidate Genes and Genetic Markers for Milk Production and Mastitis

Transcriptome Signature of the Lactation Process in a Fat-Tailed Sheep Identifes with Integrative Approach of RNA-Seq and Supervised Machine Learning Models

Cellular Senescence Bypass Screen Identifies New Putative Tumor

UC Davis UC Davis Previously Published Works

A Comparative Study of the 5' Flanking Sequences of the Αs1- and Β-Casein Genes: Human and Other Mammalian Species

Multispecies Comparative Analysis of a Mammalian-Specific Genomic Domain Encoding Secretory Proteins

Analysis of Whole Genome Resequencing Datasets from a Worldwide Sample of Sheep Breeds to Identify Potential Causal Mutations Inﬂuencing Milk Composition Traits

Case Report Application of Microarray-Based Comparative Genomic Hybridization in Prenatal and Postnatal Settings: Three Case Reports

Zinc-Finger Nickase-Mediated Insertion of the Lysostaphin Gene Into the Beta-Casein Locus in Cloned Cows

1 Supplementary Material Figure S1. Volcano Plot of Differentially

Mouse Anti-Human CSN2 Monoclonal Antibody, Clone G30.25 (CABT-B10036) This Product Is for Research Use Only and Is Not Intended for Diagnostic Use

A Genome-Wide Scan for Signatures of Differential Artificial Selection in Ten Cattle Breeds Sophie Rothammer1, Doris Seichter2, Martin Förster1 and Ivica Medugorac1*