İçeriğe geç

Genetik dizgi işleme algoritması (Needleman Wunsch Algorithm)

Algorithm

Merhabalar bu yazımda Swift ile iki string değerin. Verilen ölçüm metriclerine göre tablo oluşturup benzerliğini bulan Needleman Wunsch algoritmasını paylaşacağım.

Bu algoritmanın genel kullanımı protein veya nükleotit dizilerini hizalamak için kullanılanılır. Genetik dna dizilimlerinin bir biri arasındaki benzerliğini ortaya çıkarmaktır.

Algoritmayı kullanmak için önce

 • Eşleşme: İki karakterin aynı olması
 • Eşleşmeme: İki karakterin farklı olması
 • Boşluk: Bir karakterin, diğer dizideki boşluğa denk gelmesi

gibi durumların puanları belirlenmeli ve buna göre işlem yapılmalıdır.

Örnek olarak Eşleşme değeri = + 1 puan , Eşleşmeme değeri = -1 puan , Boşluk değeri = -1 puan olarak verilebilinir.

Yukardaki gibi bir tablo oluşturulur ve buna göre değerler belirlenir. Ben bu yazımda algoritmaya derinlemesine giriş yapmayacağım amacım Swift dili ile bu algoritmayı nasıl yazarız bunu paylaşmak.

Aşağıda verdiğiniz değere göre algoritma için tabloyu otomatik olarak oluşturan ve tablodaki değerlerin geliş yerlerinide döndüren kodu inceleyebilirsiniz.

extension String {
  
  subscript(idx: Int) -> Character {
    guard let strIdx = index(startIndex, offsetBy: idx, limitedBy: endIndex)
      else { fatalError("String error") }
    return self[strIdx]
  }
  
  func substr(to idx:Int) -> String {
    
    guard let strIdx = index(startIndex, offsetBy: idx, limitedBy: endIndex)
      else { fatalError("String error") }
    
    return self.substring(to: strIdx)
    
    
  }
  
  func substr(from idx:Int) -> String {
    
    guard let strIdx = index(startIndex, offsetBy: idx, limitedBy: endIndex)
      else { fatalError("String error") }
    
    return self.substring(from: strIdx)
    
  }
  
  func reverse() -> String {
    
    
    return String(self.characters.reversed())
    
  }
  
  
}

// -------

func NeedlemanWunchTableCreate(DNA_1:String,DNA_2:String,match:Int,gap:Int,mismatch:Int) -> (matrix:[[Int]],matrixCord:[[String]]) {
  
  
  var matrix:[[Int]] = [[Int]](repeating:[Int](repeating:0, count: DNA_1.characters.count + 1), count: DNA_2.characters.count + 1)
  var matrixSTR:[[String]] = [[String]](repeating:[String](repeating:"", count: DNA_1.characters.count + 1), count: DNA_2.characters.count + 1)
  var tmp:Int = 0
  
  matrix[0][0] = 0
  
  for i in 1...DNA_1.characters.count {
    tmp += gap
    matrix[0][i] = matrix[0][i] + tmp
  }
  
  tmp = 0
  
  for i in 1...DNA_2.characters.count {
    tmp += gap
    matrix[i][0] = matrix[i][0] + tmp
  }
  
  // MATRİX TABLE CREATE
  
  for k in 0...DNA_2.characters.count - 1 {
    
    for i in 0...DNA_1.characters.count - 1 {
      
      if DNA_2[k] == DNA_1[i] {
        
        matrix[k+1][i+1] = matrix[k][i] + match
        matrixSTR[k+1][i+1] = "DİAG"
        
      } else {
        
        if matrix[k][i+1] > matrix[k][i] && matrix[k][i+1] > matrix[k+1][i] {
          
          matrix[k+1][i+1] = matrix[k][i+1] + gap
          matrixSTR[k+1][i+1] = "UP"
          
        }
          
        else {
          
          if matrix[k+1][i] > matrix[k][i] {
            
            matrix[k+1][i+1] = matrix[k+1][i] + gap
            matrixSTR[k+1][i+1] = "LEFT"
            
          } else {
            
            matrix[k+1][i+1] = matrix[k][i] + mismatch
            matrixSTR[k+1][i+1] = "BOTTOM"
          }
          
        }
        
      }
      
    }
    
  }
  
  return (matrix,matrixSTR)
  
}

// match:5 gap:-2 mismatch:-1

// TCCTA
// TCATA

let val = NeedlemanWunchTableCreate(DNA_1: "TCCTA", DNA_2: "TCATA", match: 5, gap: -2, mismatch: -1)
val.matrix // table
val.matrixCord // table row cord

Github link.

 

Tarih:AlgorithmSwift

Bu yazı yorumlara kapalı.

Copyright © 2021 Kenan Atmaca