Questions tagged «bioinformatics»

30
沃森克里克回文
问题 创建一个可以确定任意DNA字符串是否为Watson-Crick回文的函数。如果该字符串是Watson-Crick回文,则该函数将获取一个DNA字符串并输出一个真值,否则返回一个假值。(True和False也可以分别表示为1和0。) DNA字符串可以全部大写或全部小写,具体取决于您的喜好。 同样,DNA字符串将不会为空。 说明 当一个DNA字符串的反向互补序列等于其自身时,即为沃森-克里克回文。 给定一个DNA字符串,首先将其反转,然后根据DNA碱基(A↔T和C↔G)对每个字符进行补充。如果原始字符串等于反补字符串,则为Watson-Crick回文。 有关更多信息,请参见此问题。这是一个不同的挑战,您必须找到DNA字符串中最长的子字符串,其中该子字符串是Watson-Crick回文。 目标 这是代码高尔夫球,最短的代码获胜。 测试用例 格式为<input> = <output>。 ATCGCGAT = true AGT = false GTGACGTCAC = true GCAGTGA = false GCGC = true AACTGCGTTTAC = false ACTG = false

9
从RNA到蛋白质的翻译
RNA和DNA一样,是在细胞中编码遗传信息的分子。它由核苷酸组成,由碱基腺嘌呤(A),胞嘧啶(C),鸟嘌呤(G)和尿嘧啶(U)表示。* 密码子是三个核苷酸的序列。 蛋白质是具有多种功能的大分子,例如在头发和指甲中发现的角蛋白和在血细胞中携带氧气的血红蛋白。它们由氨基酸组成,氨基酸在RNA分子中被编码为密码子。有时,不同的密码子可能编码相同的氨基酸。每个氨基酸通常由单个字母表示,例如H代表组氨酸。 给定一个序列ACGU,可以将其翻译成相应的蛋白质字符串吗? * DNA由ACGT组成,其中T为胸腺嘧啶。在DNA到RNA转录过程中,胸腺嘧啶被尿嘧啶替代。 输入值 输入将是仅包含ACGU大写字符的单个字符串。您可以为此挑战编写函数或完整程序。 输出量 您可以选择通过打印或返回字符串来输出(后一种选择仅在函数的情况下可用)。 翻译应该开始以起始密码子(AUG表示为M)并且结束于终止密码子(之一UAA,UAG或UGA表示为*)。在四种情况下,输入可能无效: 输入不以起始密码子开头 输入不以终止密码结尾 输入的长度不是3的倍数 输入的结尾处包含终止密码子 在所有这些情况下,Error都应输出。请注意,与终止密码子不同,起始密码子可能会在字符串开头之后出现。 否则,您应该通过以下RNA密码表将每个密码转换为各自的氨基酸: * UAA UAG UGA A GCU GCC GCA GCG C UGU UGC D GAU GAC E GAA GAG F UUU UUC G GGU GGC GGA GGG H CAU CAC I AUU AUC AUA …

20
分解一个数字!
您的任务是使用以下格式分解数字。 这与基本转换类似,不同之处在于digits,您列出了values,而不是在基本列表中列出,这样列表就加到了输入上。 如果给定的基为n,则列表中的每个数字都必须采用的形式k*(n**m),其中0<=k<n和m在整个列表中都是唯一的。 眼镜 任何合理的输入/输出格式。您的程序/功能需要2个输入并输出一个列表。 输出列表可以是任何顺序。 0 可以排除或包含。 0允许领导。 允许内置。 测试用例 number base converted list input1 input2 output 123456 10 [100000,20000,3000,400,50,6] or [6,50,400,3000,20000,100000] 11 2 [8,2,1] or [0,0,0,0,8,0,2,1] 727 20 [400,320,7] 101 10 [100,1] or [100,0,1] 计分 这是代码高尔夫球。以字节为单位的最短解决方案获胜。
16 code-golf  number  sequence  number-theory  base-conversion  code-golf  bitwise  hashing  code-golf  string  ascii-art  whitespace  code-golf  math  code-golf  code-golf  image-processing  counting  code-golf  math  arithmetic  checksum  code-golf  code-golf  math  arithmetic  number-theory  code-golf  array-manipulation  random  code-golf  string  code-golf  math  ascii-art  base-conversion  code-golf  graphical-output  geometry  3d  code-golf  math  linear-algebra  matrix  code-golf  math  number  sequence  code-golf  array-manipulation  code-golf  math  matrix  linear-algebra  code-golf  number  sequence  counting  code-golf  string  code-golf  string  restricted-source  quine  sorting  code-golf  string  geometry  code-golf  string  code-golf  networking  code-golf  base-conversion  code-golf  math  matrix  code-golf  arithmetic  linear-algebra  matrix  code-golf  number  arithmetic  grid  code-golf  number  source-layout  code-golf  string  bitwise  checksum  code-golf  array-manipulation  code-golf  string  probability-theory  code-golf  tips  code-golf  sequence  code-golf  string  math  sequence  calculus  code-golf  string  palindrome  bioinformatics  code-golf  math  combinatorics  counting  permutations  code-golf  parsing  logic-gates  code-golf  arithmetic  number-theory  combinatorics  code-golf  math  sequence  polynomials  integer  code-golf  string  ascii-art  chess  code-golf  string  code-golf  number  code-golf  string  ascii-art  parsing  code-golf  code-golf  number  natural-language  conversion  code-golf  arithmetic  code-golf  string  code-golf  ascii-art  decision-problem 

7
最长反向回文DNA子串
您可能知道,DNA中有四个碱基-腺嘌呤(A),胞嘧啶(C),鸟嘌呤(G)和胸腺嘧啶(T)。通常A与之结合T并C结合G,形成DNA双螺旋结构的“梯级” 。 我们将基数的补语定义为它所键合的基数-即Ais T的补语,Tis A的补语,Cis G的补语和Gis 的补语C。我们还可以将DNA字符串的补码定义为每个碱基都互补的字符串,例如GATATCis 的补码CTATAG。 由于DNA的双链结构,一条链上的碱基与另一条链上的碱基互补。但是,DNA具有方向,并且DNA转录在两条链上以相反的方向发生。因此,分子生物学家通常对DNA字符串的反向补体感兴趣-实际上是字符串的反向补体的反义。 为了扩展前面的示例,的反向补码GATATC是CTATAG向后的,因此GATATC。您可能已经注意到,在此示例中,反向补码等于原始字符串-我们称此类字符串为反向回文。* 给定一串DNA,您能找到最长的反回文子串吗? *我使用“反向回文”(Rosalind)一词来区别回文的通常含义。 输入值 输入将是仅包含ACGT大写字符的单个字符串。您可以为此挑战编写函数或完整程序。 输出量 您可以选择通过打印还是返回输出(后一种选择仅在功能情况下可用)。 如果有唯一的解决方案,则程序应输出输入字符串中最长的反向回文子字符串。如果存在多个解决方案,则可以输出其中任何一个,也可以全部输出(您的选择)。如果选择全部输出,则可以复制。 确保输入的解长度至少为2。 工作的例子 ATGGATCCG -> GGATCC 反向补码GGATCC本身(GGATCC --complement--> CCTAGG --reverse--> GGATCC),GGATCC反向回文也是如此。GATC也是一个反向回文,但它不是最长的。 测试用例 AT -> AT CGT -> CG AGCA -> GC GATTACA -> AT, TA ATGGATCCG -> GGATCC CCCCCGGGGG -> CCCCCGGGGG ACATATATAGACT -> ATATAT, …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.