Fasta Files einlesen und bearbeiten

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
johnny_1992
User
Beiträge: 1
Registriert: Samstag 25. Juli 2020, 17:30

Hallo alle zusammen,

ich bin neu hier und habe die grundlagen in python erst vor kurzem gelernt. Aus diesem Grund habe ich eine Frage zu einem code.Ich arbeite an einem Code, der eine Fasta-Datei lesen und den Header jeder Sequenz löschen soll.
Mein Code zum Lesen der Datei:

____________________________________
def read_fasta(inputfile):
with open(inputfile,'r') as f:
file=f.readlines()
f.close
return file

fasta_file=read_fasta('SELEX_100_reads.txt')

print(fasta_file)
____________________________________________
Output :

['@DBV2SVN1:110:B:7:1101:1456:2092\n', 'CTAAAAAGCGAGTGCGNCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNANNNNNNCNNNNNNNNAAACANNAAGGTAAGAAACAAGCACAGATGAGAGC\n', '\n', '+\n', '#####################################################################################################\n', '\n', '@DBV2SVN1:110:B:7:1101:2491:2141\n', 'AAGTGAGCAAACAGAAACATAGTGCGGAGTGGGAAAATGAGACTCAAAAAAAGAGTGTGGGTATTCAGTAGGGGATATTAGGCCACAATACGAAAGAGCAA\n', '\n', '+\n', '#####################################################################################################\n', '\n', '@DBV2SVN1:110:B:7:1101:2924:2130\n'......]
______________________________________________________

Output ist eine Liste mit DNA Sequenzen (AAGT oder CTAAAA etc.) . Zu jeder Sequenz gibt es Header, die ich für jede Sequenz entfernen möchte.

Mein output sollte somit so aussehen:

[''CTAAAAAGCGAGTGCGNCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNANNNNNNCNNNNNNNNAAACANNAAGGTAAGAAACAAGCACAGATGAGAGC', 'AAGTGAGCAAACAGAAACATAGTGCGGAGTGGGAAAATGAGACTCAAAAAAAGAGTGTGGGTATTCAGTAGGGGATATTAGGCCACAATACGAAAGAGCAA', .....]

Ich würde mich über eure Hilfe sehr freuen!!

Liebe Grüße,

mik
Antworten