Tin sinh học bộ gen, hay genomic bioinformatic, là lĩnh vực kết hợp giữa sinh học, công nghệ thông tin và toán học. Giúp phân tích và dự đoán trình tự bộ gen của các sinh vật. Đây là bước quan trọng trong việc hiểu cấu trúc. Chúng cũng giúp hiểu về chức năng và tiến hóa của gen. Từ đó mở ra khả năng ứng dụng trong y học, nông nghiệp và công nghệ sinh học.
Dự đoán trình tự bộ gen của sinh vật nhân sơ (prokaryote)
Ở sinh vật nhân sơ, chẳng hạn như vi khuẩn, bộ gen thường có kích thước nhỏ. Cấu trúc cũng đơn giản và không chứa intron.
Quá trình dự đoán trình tự bộ gen của prokaryote chủ yếu dựa vào việc xác định khung đọc mở (ORF – Open Reading Frame). Quá trình này cũng gồm các vùng điều hòa gen.
Các công cụ tin sinh học bộ gen như Prokka, GeneMark hoặc Glimmer được sử dụng phổ biến để nhận diện gen mã hóa protein và RNA.
Nhờ tính đơn giản, việc giải mã và chú thích bộ gen của sinh vật nhân sơ có thể đạt độ chính xác cao. Hỗ trợ nghiên cứu về kháng kháng sinh, chuyển hóa năng lượng và sản xuất enzyme công nghiệp.
Đối với sinh vật nhân thực (eukaryote)
Ngược lại, bộ gen của sinh vật nhân thực có kích thước lớn hơn nhiều và chứa nhiều intron. Đây là vùng lặp và đoạn không mã hóa.
Do đó, việc dự đoán trình tự gen ở eukaryote đòi hỏi các phương pháp tính toán phức tạp hơn. Kết hợp giữa dữ liệu giải trình tự (sequencing data). Cũng như thông tin biểu hiện gen (transcriptome) và các mô hình học máy.
Những công cụ như AUGUSTUS, MAKER hay BRAKER được phát triển để tối ưu quá trình chú thích gen. Đặc biệt là trong các sinh vật như nấm, thực vật và động vật.
>>>> Làm sao để xem cấu trúc 3D của protein dễ dàng? Xem ngay!!
Vai trò của tin sinh học bộ gen trong nghiên cứu hiện đại
Tin sinh học bộ gen giúp dự đoán và chú thích bộ gen.
Chúng còn góp phần hiểu sâu hơn về sự tiến hóa của sinh vật. Cũng như cơ chế bệnh lý ở người, và phát triển các ứng dụng y sinh học.
Việc phân tích toàn bộ bộ gen giúp xác định gen chức năng. Đồng thời phát hiện biến dị di truyền và xây dựng bản đồ gen. Việc này phục vụ cho nghiên cứu thuốc, nông nghiệp và công nghệ sinh học.
Trong tương lai, genomic bioinformatic sẽ tiếp tục là nền tảng cho y học chính xác. Góp phần chỉnh sửa gen và phát triển sinh học tổng hợp. Đây là những lĩnh vực mang tính cách mạng trong thế kỷ 21.

