Bestimmte Buchstaben markieren

BadMan2.0

Lt. Junior Grade
Registriert
Jan. 2017
Beiträge
398
Hallo erstmal...

ich schildere erstmal was mein vorhaben ist bzw was mein Problem ist:
Ich habe verschiedene Proteine die ich mittels eines Tools in Buchstaben unwandle. Und dazu habe ich ein weiteres Tool mit dem ich mir anzeigen lassen kann an welcher stelle nun das Protein durch ein bestimmtes Enzym gespalten wird. Und genau diese stelle muss ich dann markieren.
Nun kommen wir zum Problem:
Das Protein hat ~3400 Buchstaben und mit dem Enzym hab ich ~1500 Spaltstelle raus bekommen.
Per hand das zu markieren würde warscheinlich ein paar Tage dauern. Leide hab ich nicht so viel Zeit für jedes einzelne Protein und wollte desshalb wissen ob sich da was mit Excel machen lässt.
Ich hatte mir überlegt, dass man die ganzen Buchstaben in Excel untereinander einfügt (pro Zelle 1 Buchstabe) und dann die Spaltstellen, sodass am Ende die Spaltstellen markiert sind.
Am ende soll das ganze in PP eingefügt werden und zwar nebeneinander in 10er Paaren, so in etwa:
10 20 30 40 50
XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX

Ich hoffe ihr versteht was ich meine.
Das einzige was ich dazu im Netz gefunden habe war, das man solche speziellen Sachen mittels Macro-code umsetzten könnte. Hab davon aber keine Ahnung; bekomme es noch nicht mal hin das er mir nur ein buchstabe pro Zelle einfügt.

Ich hoffe ihr könnt mir da weiterhelfen.

edit*
Leider werden die Leerräume zwischen den Zahlen nicht übernommen🙈
 
Excel's Funktion zu “Text in Spalten” mit Leerzeichen als Trenner?
Excel-Text-in-Spalten.jpg

Edit: Ansonsten einfach mal Datei als Text anhängen, vielleicht kann Dir der Ein oder Andere ja schnell helfen.

… weiß TechFA
 
Zuletzt bearbeitet:
Per Hand ist das wahrscheinlich auch sehr fehleranfällig.

In welchem Format liegen die Protein-Buchstaben und die jeweiligen Spaltstellen vor?
 
Ich hab mal die Datei mit der Buchstabenfolge angehängt.

TechFA schrieb:
Excel's Funktion zu “Text in Spalten” mit Leerzeichen als Trenner?Anhang anzeigen 1099321
Bei der Menge an Buchstaben lohnt es sich zeitlich einfach nicht die ganzen Zellen mit mit Leerzeichen zu versehen.

Um es vlt. nochmal ein bisschen verständlicher zu erklären:
Es findet jetzt z.B. an der 77 Stelle eine Spaltung statt, dann nehm ich mir die 77 geb sie Excel und Excel markiert dann den Buchstaben in der 77. Zeile. Und im besten Fall wäre es so, dass ich direkt die 1500 Nummern dort einfügen kann und Excel mir dann die 1500 Buchstaben markiert. (fals es überhaupt so möglich ist)

Ich werd mir mal Morgen zur Macro-Code Funktion ein paar Tutorials ansehen, villeicht hab ich dann die Lösung.
Ergänzung ()

Janush schrieb:
In welchem Format liegen die Protein-Buchstaben und die jeweiligen Spaltstellen vor?
Ich hab beides in jeweils ein txt Dokument grpackt. Bei der Datei mit den Spaltstellen wären nur die zu beachten deren Wert über ~0,8 leigt.
 

Anhänge

  • Gefällt mir
Reaktionen: TechFA
Mmmhhhh, ist das ne einmalige Sache, oder kommt sowas öfter vor?

Wahrscheinlich brauchst du nicht unbedingt Excel dafür...sieht eher aus wie eine Aufgabe für Python, oder so.

Hast du Programmiererfahrung in irgendeiner Sprache?

Wann ist deine Deadline?
 
Also Programmiererfahrungen hab ich jetzt eher nicht, hab mich früher mal dran versucht (Hobbymäßig) aber nach kurzer zeit wieder aufgehört.

Die Deadline wäre übermorgen, desshalb siehts mit selber Programmieren schlecht aus. Und danne gibt es dann noch 13 weitere Proteine...
 
Vorab: Mit einer vernuepftigen Programmiersprache eleganter und einfacher.

Excel:

Datei 1: Proteindaten
Inhalt markieren, kopieren, in Excel einfuegen -> Text in Spalten, Trennzeichen: Tabstopp


Datei 2: Buchstabensalat
Mit "notepad++"
-> Suchen und Ersetzen: "\r\n" gegen nichts ersetzen
-> Suchen und Ersetzen: (.) durch "\1 " ersetzen (Haken bei "Reguläre Ausdrücke finden" + "\n \r")
Ergebnis: Alle Buchstaben in einer Zeile, getrennt durch ein Leerzeichen.

-> Inhalt markieren, kopieren und in Excel einfuegen.
Ergebnis: Jeder Buchstabe sollte in eine eigene Zelle kopiert werden, ansonsten -> "Text in Spalten"

-> Alle Buchstaben markieren, kopieren
-> Zelle A1 markieren, einfuegen, Option: Transponiert
Ergebnis: Alle Buchstaben sind untereinander, ab Zeile 1

Zeile = Position im Protein

B1: "=Zählenwenn(zeile(); "Spalte mit Position in Protein")>0"
Formel bis Spaltenende kopieren (Doppelklick auf die untere rechte Ecke; $ nicht vergessen).
Ergebnis: Wahr oder Falsch, je nachdem, ob Position in Datei 1 gefunden wurde.

Jetzt koennte man die Die Positionen entweder ueber eine bedingte Formatierung automatisch einfaerben.
Dazu die Formel einfach direkt in A1 als bedingte Formatierung einfuegen und den Bereich erweitern.
Oder man filtert die Liste nach Wahr, markiert alles und faerbt sie manuell ein.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: BadMan2.0
@Scientist erstmal vielen Dank für die Anleitung. Werde das Morgen direkt mal ausprobieren wenn ich wieder am PC bin. (mein Gehirn ist schon im Standby😁)
 
Nachtrag:
Die Gruppierung vergessen ...
Einzelne Buchstaben in einer Gruppe von Buchstaben zu markieren, geht nicht ohne VBA und auch da bin ich mir nicht sicher, ob das geht.

Man koennte die Gruppierung vielleicht ueber einzelne Zellen realisieren und dann die Leerzeichen entfernen.
Das muss ich erst testen.
 
Ich sehe ehrlich gesagt nicht, das Excel hier das richtige Tool ist. Großartig programmieren muss man da aber auch nicht. Das sollte sich Recht einfach in einer bash oder auf Windows eben mit Powershell und regex gehen.
 
@Keylan
Da waere ich an eine konkrete Idee fuer die Umsetzung interessiert.
Wie wuerde man da die Position markieren (Fett oder farblich).

@BadMan2.0
Abschnitt in Zeile 2 markieren, in PP einfuegen.
-> Suchen und Ersetzen: " " gegen nichts
-> Suchen und ersetzen: ";" gegen " " oder beliebiges Trennzeichen.

PS: 3.300 Zeichen solltest du nicht aufeinmal und nicht auf ein Blatt in PP einfuegen ;)
PPS: Der Grenzwert wird in der Datei nicht beruecksichtigt.
 

Anhänge

Die Deadline ist ganz schön knapp, da kann ich dir nicht viel helfen. Bin die Woche noch im Urlaub :-)

Aber hier sind genug fähige Leute unterwegs, die dich in die richtige Richtung schicken können, wenn sie wollen.

Viel Glück, denn 13 Proteine bis morgen händisch zu bearbeiten, wird wahrscheinlich sportlich.
 
Ich würde das Ganze in Word übernehmen. Dort ist es einfach, irgendwelche Textmuster farbig zu markieren.
 
Das klappt alle erstmal super. Nur noch eine kleine Sache, kann man, wenn man die Buchstaben in PP einfügt, über jeden 10. Buchstaben die entsprechende Nummer einfügen lassen?
1625737844660.png

Das wär jetzt aber auch nicht sehr schlimm, wenns nicht geht.
@Janush ich hab für jedes Protein 4 Tage Zeit.;)
 
In PP nicht. Aber sicher in dem Programm, mit dem du die Texte vorbereitest. Wie hast du es gemacht?
 
So sieht das Original aus.
Ich drücke dann auf FASTA und bekomme die Sequenz dann ohne Zahlen und Leerzeichen.
1625739599558.png
 
Dann pass doch einfach die Darstellung in Excel so an, dass es dieser Form entspricht und fuege das ganze als Tabelle dann in PP oder Word ein.
Tabellenraender anschließend einfach ausblenden.
 
  • Gefällt mir
Reaktionen: cruse
Ein hab ich noch nicht ganz verstanden und zwar;
wie kommt diese wagerechte Anordung zu stande? Köntest du das vlt. nochmal genauer erklären?
1625753391412.png
 
Mit Indirekt() kann man ein Zellverweis als Text zusammenbasteln.
Funktioniert im Prinzip wie Verketten(), nur dass das Ergebnis als Verweis ausgewertet wird.
Indirekt() funktioniert aber nur mit Verweisen innerhalb der Datei.

In E2 steht nichts anderes als "=A & Inhalt aus E1", also "=A1".

Warum du das als Array-Formel bestaetigt hast, kann ich dir jedoch nicht erklaeren.
 
  • Gefällt mir
Reaktionen: BadMan2.0
Da stimm irgend etwas mit der Formel bei der Nummerierung nicht. Die 10 gibt es doppelt und kurz vor der 100, 200, 300,... ist es noch verrückter.
Ich hab mich mal ein bisschen mit diesen Formeln auseinander gesetzt und werd aber nicht schlau draus was da falsch sein könnte.
 

Anhänge

  • SmartSelect_20210708-193233_Excel.jpg
    SmartSelect_20210708-193233_Excel.jpg
    68,9 KB · Aufrufe: 215
  • SmartSelect_20210708-193145_Excel.jpg
    SmartSelect_20210708-193145_Excel.jpg
    17,8 KB · Aufrufe: 214
Zurück
Oben