Canonical Form for Poset Codes and Coding-Decoding Schemes for Expected Loss

Universidade Estadual de Campinas Instituto de Matemática, Estatística e Computação Científica Jerry Anderson Pinheiro FORMA CANÔNICA PARA CÓDIGOS POSET E ESQUEMAS DE CODIFICAÇÃO-DECODIFICAÇÃO PARA PERDA ESPERADA CANONICAL FORM FOR POSET CODES AND CODING-DECODING SCHEMES FOR EXPECTED LOSS Campinas 2016 Jerry Anderson Pinheiro Canonical Form for Poset Codes and Coding-Decoding Schemes for Expected Loss Forma Canônica para Códigos Poset e Esquemas de Codificação-Decodificação para Perda Esperada Tese apresentada ao Instituto de Matemática, Estatística e Computação Científica da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Doutor em Matemática. Thesis presented to the Institute of Mathe- matics, Statistics and Scientific Computing of the University of Campinas in partial ful- fillment of the requirements for the degree of Doctor in Mathematics. Orientador: Marcelo Firer Este exemplar corresponde à versão final da tese defendida pelo aluno Jerry Anderson Pinheiro, e orien- tada pelo Prof. Dr. Marcelo Firer. Campinas 2016 Agência(s) de fomento e nº(s) de processo(s): CNPq, 141586/2014-1; CAPES Ficha catalográfica Universidade Estadual de Campinas Biblioteca do Instituto de Matemática, Estatística e Computação Científica Ana Regina Machado - CRB 8/5467 Pinheiro, Jerry Anderson, 1985- P655c PinCanonical form for poset codes and coding-decoding schemes for expected loss / Jerry Anderson Pinheiro. – Campinas, SP : [s.n.], 2016. PinOrientador: Marcelo Firer. PinTese (doutorado) – Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica. Pin1. Métricas sobre ordens parciais. 2. Códigos corretores de erros (Teoria da informação). I. Firer, Marcelo,1961-. II. Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica. III. Título. Informações para Biblioteca Digital Título em outro idioma: Forma canônica para códigos poset e esquemas de codificação- decodificação para perda esperada Palavras-chave em inglês: Poset metrics Correcting codes (Information theory) Área de concentração: Matemática Titulação: Doutor em Matemática Banca examinadora: Marcelo Firer [Orientador] Reginaldo Palazzo Junior Marcelo Muniz Silva Alves Marcelo da Silva Pinho Emerson Luiz do Monte Carmelo Data de defesa: 25-04-2016 Programa de Pós-Graduação: Matemática Powered by TCPDF (www.tcpdf.org) Tese de Doutorado defendida em 25 de abril de 2016 e aprovada pela Banca Examinadora composta pelos Profs. Drs. Prof. Dr. MARCELO FIRER Prof. Dr. REGINALDO PALAZZO JUNIOR Prof. Dr. MARCELO MUNIZ SILVA ALVES Prof. Dr. MARCELO DA SILVA PINHO Prof. Dr. EMERSON LUIZ DO MONTE CARMELO A Ata da defesa com as respectivas assinaturas dos membros encontra-se no processo de vida acadêmica do aluno. Agradecimentos Durante esses pouco mais de 4 anos de trabalho, inúmeras foram as pessoas e instituições que de alguma forma me ajudaram nessa caminhada. Para algumas, uma página de agradecimento seria pouco, no entanto, corri o risco, fiz uma síntese e omiti algumas, porém não as esqueci. Agradeço aos meus pais, Zilton e Adiles, pelo incondicional apoio. Apesar da distância que alimenta a saudade, vocês são os principais culpados desta conquista. Agradeço aos professores Marcelo Firer e Marcus Greferath; o primeiro, não apenas pela orientação do doutorado na Unicamp mas também pela confiança depositada e pelos ensinamentos; e o segundo, pela orientação durante o período de um ano que passei na University College Dublin. Para que um projeto seja iniciado, sempre há quem dê uma motivação e semeie uma ideia, um dos principais responsáveis para que eu me aventurasse pela pós graduação na Unicamp, e a quem deixo aqui meus agradecimentos, foi o professor Luciano Panek. Uma pessoa não consegue passar tanto tempo em um lugar sem cultivar amigos, cultivei muitos, alguns listarei aqui, porém muito mais ficarão na memória. Agradeço aos companheiros de pós graduação Cleber, Felix, João (Jhon); aos companheiros de lab- oratório, Campello, Ana, Bruno, Elen, Akemi, Julianna (Ju), Cintya, Giselle, Eleonésio, Alessandro, Adriana e Cláudio; aos meus “irmãos” de trabalho “filhos” do mesmo orientador: Marcos (Marquinhos), Roberto, Christiane (Chris), Rafael e Luciano, este último, parceiro nas “pint” de Guinness nos pubs de Dublin; e aos amigos que cultivei na Irlanda durante meu doutorado sanduíche, Jens, Oliver, Cornelia, Ana e Carolina (Carol), as duas últimas, parceiras em nossa “trip” pela Irlanda. Agradeço ao CNPq pelo suporte financeiro. Resumo No contexto de códigos corretores de erros, métricas são utilizadas para definir decodificadores de máxima proximidade, uma alternativa aos decodificadores de máxima verossimilhança. A família de métricas poset tem sido extensivamente estudada no contexto de teoria de códigos. Considerando a estrutura do grupo de isometrias lineares, é obtida uma forma canônica para matrizes geradoras de códigos lineares. Esta forma canônica permite obter expressões e limitantes analíticos para alguns invariantes clássicos da teoria: raio de empacotamento e complexidade de síndrome. Ainda, substituindo a probabilidade de erro pela perda esperada definida pelo desvio médio quadrático (entre a informação original e a informação decodificada), definimos uma proposta de codificação com ordem lexicográfica que, em algumas situações é ótima e em outras, as simulações feitas sugerem um desempenho ao menos subótimo. Finalmente, relacionamos a medida de perda esperada com proteção desigual de erros, fornecendo uma construção de códigos com dois níveis de proteção desigual de erros e com perda esperada menor que a obtida pelo produto de dois códigos ótimos, que separam as informações que são protegidas de modo diferenciado. Palavras-chave: Métricas Sobre Ordens Parciais, Códigos Corretores de Er- ros (Teoria da Informação) Abstract In the context of error-correcting codes, metrics are used to define minimum distance decoders, an alternative to maximum likelihood decoders. The family of poset metrics has been extensively studied in the context of coding theory. Considering the structure of the group of linear isometries, we obtain a canonical form for generator matrices of linear codes. The canonical form allows to obtain analytics expressions and bounds for classical invariants of the theory: packing radius and syndrome complexity. By substituting the error probability by the expected loss defined by the mean square deviation (between the original information and the decoded information), we propose an encoder scheme which, in some situations is optimal, and in others the simulations suggest a performance at least sub-optimal. Finally, we relate the expected loss measure with unequal error protection, providing a construction of codes with two levels of unequal error protection and expected loss smaller than the one obtained by the product of two optimal codes, which divide the information that is protected differently. Keywords: Poset Metrics, Error Correcting Codes (Information Theory). Contents Introduction 10 1 Metrics in Coding Theory 14 1.1 Decoders over Discrete Channels . 15 1.2 Decoding Schemes . 21 1.2.1 Syndrome Decoding . 28 1.3 Matching Metrics and Channels . 31 2 Metrics Induced by Partially Ordered Sets 34 2.1 Linear Codes . 34 2.1.1 Code Equivalence . 38 2.2 Partially Ordered Sets . 40 2.3 Poset Metrics . 44 2.3.1 Group of Linear Isometries for Poset Metrics . 45 2.3.2 Packing Radius of Poset Codes . 47 3 Canonical Form 52 3.1 Canonical Form for Hierarchical Metrics . 53 3.2 Partitions and Decompositions . 56 3.2.1 Hierarchical Bounds . 66 3.2.2 Packing Radius Bounds . 70 3.2.3 Construction of Maximal P-Decompositions . 71 3.2.4 Complexity of Syndrome Decoding Algorithm . 79 4 Expected Loss 84 4.1 Expected Loss . 85 4.2 Bayes Encoders . 90 4.3 A particular Case . 93 4.4 Expected Loss and Unequal Error Protection . 98 Future Perspectives 104 Extended Poset Metrics . 104 Better Hierarchical Bounds . 105 Bibliography 107 Index 111 10 Introduction Metrics are mathematical structures of interest in coding theory. Several works are devoted to the study of metrics in the context of coding theory, and the best known and investigated metric in this context is the Hamming metric. It was suggested by R. W. Hamming in [25] when describing a geometric model of a code. Later, in ([28],1958) and ([44],1957), the Lee metric was defined, and became an interesting alternative when non-binary alphabets are used. Up to our knowledge, the first work considering metrics in a general approach is a short communication of S. W. Golomb [22] in 1969. In that work, it was described a family of additive metrics (metrics defined over an alphabet and extended additively to a set of words with a fixed length) which are still being investigated nowadays, as we can see in [41]. Recently, the interest on different and larger families of metrics in coding theory has been increased, as can be seen, for example, in [6], [2], [20] and [10]. This is partially motivated by the fact that metrics provide a decoding scheme using minimum distance, which in some cases (when metrics and channels are matched), is an alternative to Maximum a Posteriori (MAP) decoders. Also, minimum distance decoders may be used to add manageability to the decoding process, what can be achieved by the use of a Syndrome decoding algorithm, which is the most general and efficient decoding algorithm presented in this dissertation. One of those large families of metrics (with interest in coding theory) is

Load more