Hallo alle zusammen,
ich bin neu hier und habe die grundlagen in python erst vor kurzem gelernt. Aus diesem Grund habe ich eine Frage zu einem code.Ich arbeite an einem Code, der eine Fasta-Datei lesen und den Header jeder Sequenz löschen soll.
Mein Code zum Lesen der Datei:
____________________________________
def read_fasta(inputfile):
with open(inputfile,'r') as f:
file=f.readlines()
f.close
return file
fasta_file=read_fasta('SELEX_100_reads.txt')
print(fasta_file)
____________________________________________
Output :
['@DBV2SVN1:110:B:7:1101:1456:2092\n', 'CTAAAAAGCGAGTGCGNCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNANNNNNNCNNNNNNNNAAACANNAAGGTAAGAAACAAGCACAGATGAGAGC\n', '\n', '+\n', '#####################################################################################################\n', '\n', '@DBV2SVN1:110:B:7:1101:2491:2141\n', 'AAGTGAGCAAACAGAAACATAGTGCGGAGTGGGAAAATGAGACTCAAAAAAAGAGTGTGGGTATTCAGTAGGGGATATTAGGCCACAATACGAAAGAGCAA\n', '\n', '+\n', '#####################################################################################################\n', '\n', '@DBV2SVN1:110:B:7:1101:2924:2130\n'......]
______________________________________________________
Output ist eine Liste mit DNA Sequenzen (AAGT oder CTAAAA etc.) . Zu jeder Sequenz gibt es Header, die ich für jede Sequenz entfernen möchte.
Mein output sollte somit so aussehen:
[''CTAAAAAGCGAGTGCGNCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNANNNNNNCNNNNNNNNAAACANNAAGGTAAGAAACAAGCACAGATGAGAGC', 'AAGTGAGCAAACAGAAACATAGTGCGGAGTGGGAAAATGAGACTCAAAAAAAGAGTGTGGGTATTCAGTAGGGGATATTAGGCCACAATACGAAAGAGCAA', .....]
Ich würde mich über eure Hilfe sehr freuen!!
Liebe Grüße,
mik