Skip to content

Knime_2020_C

filips edited this page Jan 20, 2021 · 2 revisions

KNIME - praca samodzielna | grupa 2020-C

1. Skonstruować schemat wg poleceń:

  • przeczytać dane aktywności związków na kinazę JAK1 z pliku dostępnego tutaj.
  • usunąć kolumnę ACTIVITY_ID
  • zmienić nazwy kolumn (:bulb: tip: column rename)
    • CMPD_CHEMBLID -> ID
    • CANONICAL_SMILES -> smiles
  • przekształcić kolumnę smiles na widoczne struktury (:bulb: tip: molecule type cast)
  • znormalizować struktury chemiczne (:bulb: tip: RDKit normalizer)
  • policzyć parametry: LabuteASA, TPSA, SlogP

2. Dla tych danych:

  • przygotować wykres punktowy 2D (np z wykorzystaniem 2D/3D scatter plot):
    • na osiach TPSA / LabuteASA
    • punkty pokolorowane wg inhibicji JAK1
    • rozmiar punktów: proporcjonalny do SlogP
    • wykres zapisać jako png
  • wybrać 10 reprezentatywnych związków (Diversity picker) i tabelę zapisać jako plik excela.
  • sprawdzić korelację liniową między wartościami LabuteASA, TPSA, SlogP (:bulb: tip: linear correlation) i zapisać macierz jako png (:bulb: tip: view: correlation matrix)
  • przygotować histogram dla wartości inhibicji JAK1 i zapisać jako png

3. Workflow

  1. Podpisać trzy pierwsze węzły (F2...)
  2. Dodać adnotację do schematu (new workflow annotation) ze swoim imieniem i nazwiskiem
  3. zapisać obrazek workflow'u jako svg (file -> export to SVG)

Zaliczenie

Aaaaaaby zaliczyć sprawdzian, proszę wysłać mi pliki, z imieniem i nazwiskiem jako nazwą pliku:

  1. wykres punktowy 2D w pliku png
  2. plik excela z tabelą z 10 reprezentatywnymi związkami
  3. Plik png z macierzą korelacji
  4. Plik png z histogramem
  5. obrazek workflow'u jako plik svg

⚠️ UWAGA! Po wysłaniu plików mailem proszę skasować tymczasowe pliki z komputera (png, xls, svg).

Clone this wiki locally