Skip to content
Snippets Groups Projects
thesis.tex 7.79 KiB
\documentclass[czech,master,dept460,male,cpp]{diploma}

% --------------------------------------------------------------------------------------------------------
%                                                   PACKAGES
% --------------------------------------------------------------------------------------------------------
\usepackage[autostyle=true,czech=quotes]{csquotes} % korektni sazba uvozovek, podpora pro balik biblatex
\usepackage[backend=biber, style=iso-numeric, alldates=iso]{biblatex} % bibliografie
\usepackage{dcolumn}
\usepackage{dcolumn} % sloupce tabulky s ciselnymi hodnotami
\usepackage{subcaption}
\usepackage{listings}
\usepackage{hyperref}
\usepackage{enumitem}
\usepackage{mathrsfs}
\usepackage{enumitem}
\usepackage{amsmath}
\usepackage{amssymb}
\usepackage{graphicx}
\usepackage{tikz}
\usepackage{pgfplots}
\usepackage{dirtytalk}
\usepackage{siunitx}
\usepackage{placeins}


% --------------------------------------------------------------------------------------------------------
%                                              MY COMMANDS
% --------------------------------------------------------------------------------------------------------
\newcommand{\image}[4]{\begin{figure}[ht!] \centering \includegraphics[width=#4\linewidth]{Figures/#1} \caption{#2} \label{#3} \end{figure}}
\newcommand{\bThreed}{B$^3$D }
\newcommand{\bThreedWoSpace}{B$^3$D}
\newcommand{\closedInterval}[2]{$\langle #1;#2 \rangle$}
\newcommand{\openInterval}[2]{$(#1;#2)$}
\newcommand{\lOpenInterval}[2]{$(#1;#2 \rangle$}
\newcommand{\rOpenInterval}[2]{$\langle #1;#2)$}
\newcommand{\ddfrac}[2]{\frac{\displaystyle #1}{\displaystyle #2}}
\newcommand{\bigceil}[1]{\left\lceil #1 \right\rceil}
\newcommand{\floor}[1]{\lfloor #1 \rfloor}

% --------------------------------------------------------------------------------------------------------
%                                         PGFPLOTS CONFIGURATION
% --------------------------------------------------------------------------------------------------------
% 7cm,
\pgfplotsset{
    compat=1.9, 
    % width=\linewidth
    /pgfplots/ybar legend/.style={
    /pgfplots/legend image code/.code={%
        \draw[##1,/tikz/.cd,yshift=-0.25em]
        (0cm,0cm) rectangle (3pt,0.8em);},
    },
    /pgf/number format/use comma,
    /pgf/number format/1000 sep={\ }
}
\pgfplotsset{%
    axis line origin/.style args={#1,#2}{
        x filter/.append code={ % Check for empty or filtered out numbers
            \ifx\pgfmathresult\empty\else\pgfmathparse{\pgfmathresult-#1}\fi
        },
        y filter/.append code={
            \ifx\pgfmathresult\empty\else\pgfmathparse{\pgfmathresult-#2}\fi
        },
        xticklabel=\pgfmathparse{\tick+#1}\pgfmathprintnumber{\pgfmathresult},
        yticklabel=\pgfmathparse{\tick+#2}\pgfmathprintnumber{\pgfmathresult}
    }
}

% --------------------------------------------------------------------------------------------------------
%                                           DIPLOMA MACROS
% --------------------------------------------------------------------------------------------------------
\ThesisAuthor{Bc. Vojtěch Moravec}

\CzechThesisTitle{Metody komprese bioinformatických dat pro přenos na HPC infrastrukturu}
\EnglishThesisTitle{Data Compression Methods for Bioinformatic Data Transfer on HPC Infrastructure}

\SubmissionDate{15. 5. 2020}

\Thanks{Rád bych na tomto místě poděkoval svému vedoucímu diplomové práce \linebreak doc. Mgr. Jiřímu \mbox{Dvorskému}, Ph.D., za vstřícný přístup, ochotu a čas věnovaný k pomoci na této práci. Dále bych chtěl poděkovat Mgr. Ing. Michalu Krumniklovi, Ph.D. za jeho rady \linebreak a ochotu. V neposlední řadě bych rád poděkoval své přítelkyni a rodině za podporu.}

\ThesisAssignmentImagePath{Figures/Assignment}
\AuthorDeclarationImageFile{Figures/AuthorDeclaration.jpg}

\CzechAbstract{Bioinformatická data patří v současné době k jedním z nejdůležitějších typů dat pro klinický \linebreak a biologický výzkum. S rychlým vývojem mikroskopických technologií je kvalita a velikost datasetů stále větší. Cílem této práce je prozkoumat metody komprese bioinformatických dat. Komprese by zajistila rychlejší přenos a menší nároky na uchovávání těchto datasetů. Nejprve zběžně uvedeme existující metody bezztrátové komprese a dále se budeme detailněji zabývat kompresi ztrátovou. Konkrétně se bude jednat o algoritmy skalární a vektorové kvantizace. Tyto metody budou vyzkoušeny na reálných datech. Součástí této práce jsou výsledky zkoumání, spolu s detailní analýzou kvality ztrátové komprese a vzniklé kompresní chyby. Výsledky dokazují, že pomocí navrhnutých algoritmů, lze na testovaných datech dosáhnout dobrých kompresních výsledků. Testovaný dataset vykazuje minimálně znatelnou chybu v obraze, při velmi dobrých kompresních poměrech.}
\CzechKeywords{bioinformatická data, komprese obrazu, ztrátová komprese, skalární kvantizace, vektorová kvantizace}

\EnglishAbstract{Bioinformatical data are currently one of the most valuable data types for clinical and biological research. The fast development of microscopy techniques leads to more data with higher quality than ever before. This thesis aims to explore methods of compression of bioinformatical data. The compression would result in faster transmission times and smaller requirements for data storage. First, we describe the existing methods of lossless data compression and then we take a closer look at the lossy compression techniques. Specifically, the scalar quantization and vector quantization algorithms. These methods will be tested on real-life data.\linebreak Results of compression, with a detailed analysis of a lossy compression results and the compression error, will be presented in this work. Obtained results, prove that our algorithms can achieve very good compression for the tested data. We can keep most of the image quality while minimizing the compression ratio.}
\EnglishKeywords{bioinformatical data, image compression, lossy compression, scalar quantization, vector quantization}

% Zkratky
\AddAcronym{BPP}{Počet bitů na pixel}
\AddAcronym{CR}{Kompresní poměr}
\AddAcronym{MAE}{Průměrná absolutní chyba}
\AddAcronym{MSE}{Průměrná kvadratická chyba}
\AddAcronym{PSNR}{Špičkový poměr signálu k šumu}
\AddAcronym{QCMP}{Vlastní formát komprimovaného souboru $\qquad\qquad\qquad\qquad\qquad$ \emph{Quantization Compressed File}}

\addbibresource{citations.bib}

% Novy druh tabulkoveho sloupce, ve kterem jsou cisla zarovnana podle desetinne carky
\newcolumntype{d}[1]{D{,}{,}{#1}}

% --------------------------------------------------------------------------------------------------------
%                                               DOCUMENT
% --------------------------------------------------------------------------------------------------------
\begin{document}

\MakeTitlePages

\section{Úvod}
\label{sec:introduction}
\input{parts/introduction.tex}

\section{Bezztrátová komprese obrazu}
\label{sec:lossless_compression}
\input{parts/lossless_compression.tex}

\section{Ztrátová komprese obrazu}
\label{sec:lossy_compression}
\input{parts/lossy_compression.tex}

\section{Analýza komprese pomocí kvantizačních technik}
\label{sec:lossy_compression_analysis}
\input{parts/lossy_compression_analysis.tex}

\section{Závěr}
\label{sec:conclusion}
\input{parts/conclusion.tex}

% TODO-MAYBE(Moravec): Popsat BigDataViwer

\printbibliography[title={Literatura}, heading=bibintoc]


% Prilohy
\appendix

\section{Výsledky komprese}
\label{sec:appendix_result_images}
\input{parts/appendix/result_images.tex}
\FloatBarrier

\section{Doplňující grafy výsledků}
\label{sec:appendix_result_plots}
\input{parts/appendix/plots.tex}

\section{Doplňující tabulky}
\label{sec:appendix_result_tables}
\input{parts/appendix/tables.tex}


\end{document}