BLOcks of SUbstitution Matrix, 단백질의 sequence alignment를 할 때 사용되는 Substitution matrix

점수 측정 기준 (통계적/생물학적): sequence alignment를 평가할 때 이게 얼마나 의미 있는지 알고 싶어 한다.

그러므로 scoring matrix나 생물학적으로 의미 있는 아미노산 또는 nucleotide 쌍이 alignment에서 발생하는 확률을 묘사하는 값의 테이블이 필요하다.

각 위치에 있는 점수는 단백질 서열의 blocks of local alignments에 있는 substitution의 빈도수에 의해 얻어졌다.

숫자로 표기된 여러 세트의 BLOSUM matrix는 다른 alignment database를 사용하여 만들어 졌다.

숫자가 높은 BLOSUM matrix는 가까이 관계한 서열을 비교하는데 쓰이고, 작은 수의 matrixs는 멀리 관계된 서열을 비교하는데 쓰인다.

예를 들어 BLOSUM80는 분화가 덜 된 alignment에 쓰이고, BLOSUM45는 분화가 많이 일어난 서열에 쓰인다. Matrix는 하나의 서열에 주어진 백분율 보다 더욱 비슷한 모든 서열들을 모아 합쳐 만든 것으로, 이후 이러한 서열들과 비교를 한다.

백분율은 이름을 부치는데 사용된다. BLOSUM80를 예로 들면 80% 이상 유사한 서열들이 뭉쳐서 만들어 진 것이다.

BLOSUM r: r% 만큼의 유사성을 같는 blocks로 부터 만들어진 matrix

예: BLOSUM62는 62% 만큼의 유사성을 같는 서열들을 사용해서 만들어진 matrix로 protein BLAST의 default로 쓰인다. 실험적으로 BLOSUM62가 가장 약한 단백질 유사성을 감지하는데 가장 최선이라고 보여준 적이 있다.

This is the second item's accordion body. It is hidden by default, until the collapse plugin adds the appropriate classes that we use to style each element.

This is the third item's accordion body. It is hidden by default, until the collapse plugin adds the appropriate classes that we use to style each element.