Специальность 05.13.11 — «Математическое И Программное Обеспечение Вычислительных Машин, Комплексов И Компьютерных Сетей»

Total Page:16

File Type:pdf, Size:1020Kb

Специальность 05.13.11 — «Математическое И Программное Обеспечение Вычислительных Машин, Комплексов И Компьютерных Сетей» МЕЖГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКО-АРМЯНСКИЙ УНИВЕРСИТЕТ На правах рукописи Гукасян Цолак Гукасович МЕТОДЫ И ПРОГРАММНЫЕ СРЕДСТВА ДЛЯ ВЫЯВЛЕНИЯ ЗАИМСТВОВАНИЙ В ТЕКСТАХ НА АРМЯНСКОМ ЯЗЫКЕ Специальность 05.13.11 — «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей» Диссертация на соискание учёной степени кандидата технических наук Научный руководитель: к.ф.-м.н. Турдаков Денис Юрьевич Москва — 2021 2 Оглавление Введение ...................................... 6 Глава 1. Определение и типология заимствований ............. 14 Глава 2. Внутренние методы обнаружения заимствований ......... 18 2.1 Стилометрический подход . 19 2.1.1 Обзор литературы . 20 2.1.1.1 Обнаружение изменения стиля . 20 2.1.1.2 Обнаружение границ нарушений стиля . 22 2.1.1.3 Кластеризация по авторству . 23 2.1.2 Адаптация методов к армянскому языку . 25 2.1.2.1 Признаки . 26 2.1.2.2 Эксперименты . 27 2.1.3 Заключение . 33 2.2 Выявление технических трюков . 34 2.2.1 Скрытый текст и вставка изображений . 35 2.2.1.1 Алгоритм Майерса . 37 2.2.1.2 Алгоритмы терпения и гистограммы . 38 2.2.1.3 Сравнение разностных алгоритмов . 39 2.2.2 Замена омоглифов . 40 2.3 Выводы . 43 Глава 3. Внешние методы обнаружения заимствований .......... 45 3.1 Глобальные методы анализа сходства . 45 3.1.1 Метод отпечатков . 46 3.1.2 Метод шинглов . 47 3.1.3 Веб-поиск . 48 3.1.3.1 Сегментация текста . 48 3.1.3.2 Извлечение ключевых словосочетаний . 49 3.1.3.3 Формулировка запроса . 50 3.1.3.4 Управление поиском . 50 3 3.1.3.5 Фильтрация результатов . 51 3.1.3.6 Обсуждение . 52 3.1.4 Метрики оценки качества . 54 3.1.5 Локальные методы анализа сходства . 56 3.1.5.1 Коэффициент Жаккара . 57 3.1.5.2 Коэффициент Шимкевича-Симпсона . 58 3.1.5.3 Метод отпечатков . 58 3.1.5.4 Обнаружение парафраза . 59 3.1.5.5 Результаты и обсуждение . 68 3.2 Выводы . 70 Глава 4. Вспомогательные методы обработки текстов. ........... 72 4.1 Векторные представления слов для армянского языка . 72 4.1.1 Введение . 73 4.1.2 Предобученные модели . 75 4.1.3 Внутренная оценка . 76 4.1.4 Внешняя оценка . 79 4.1.4.1 Морфологический анализ . 80 4.1.4.2 Классификация текстов . 81 4.2 Лемматизация . 83 4.2.1 Введение . 84 4.2.2 Обзор моделей лемматизации . 85 4.2.2.1 Поиск по словарю . 86 4.2.2.2 Лемматизация на основе правил . 87 4.2.2.3 Машинное обучение . 87 4.2.3 Нейронная сеть COMBO . 90 4.2.3.1 Архитектура нейронной сети . 90 4.2.3.2 Архитектура лемматизатора . 91 4.2.3.3 Архитектура частеречного и морфологического анализатора . 92 4.2.3.4 Архитектура анализатора синтаксических зависимостей . 92 4.2.4 Эксперименты . 93 4.2.4.1 Обучающие данные . 93 4.2.4.2 Параметры обучения нейронной сети . 94 4 4.2.4.3 Базовые методы . 95 4.2.5 Совместное обучение . 96 4.2.5.1 Векторные представления . 98 4.2.5.2 Обучение с частичным привлечением учителя . 105 4.2.6 Обсуждение . 107 4.3 Исправление ошибок автоматического распознавания текстов . 108 4.3.1 Введение . 109 4.3.2 Методы обнаружения и исправления ошибок . 111 4.3.2.1 Обнаружение ошибок OCR . 111 4.3.2.2 Исправление ошибок OCR . 112 4.3.3 Эксперименты . 113 4.3.3.1 Наборы данных для обучения и тестирования . 113 4.3.3.2 Результаты и обсуждение . 115 4.4 Извлечение именованных сущностей . 118 4.4.1 Введение . 120 4.4.2 Наборы данных . 121 4.4.2.1 Автоматическая генерация обучающих данных . 121 4.4.3 Модели и эксперименты . 127 4.4.3.1 Векторные представления слов . 127 4.4.3.2 Модели распознавания и классификации сущностей . 128 4.4.3.3 Обсуждение результатов оценки качества . 129 4.5 Выводы . 131 Глава 5. Система обнаружения заимствований ............... 134 5.1 Обзор . 134 5.2 Архитектура . 137 5.3 Полнотекстовый поиск . 139 5.3.1 Обзор методов . 140 5.3.1.1 Требования к аппаратным средствам . 141 5.3.1.2 Индексация на основе блочной сортировки . 142 5.3.1.3 Однопроходная индексация в памяти . 144 5.3.1.4 Динамическая индексация . 145 5.3.2 Выбор технологий . 146 5.3.3 Настройка Apache Solr . 148 5 5.4 Поиск в интернете . 149 5.4.1 Выбор технологий . 151 5.5 Извлечение текста из документов . 152 5.6 Асинхронное исполнение задач . 153 Заключение .................................... 155 Список литературы ............................... 156 Благодарности .................................. 174 Список рисунков ................................. 175 Список таблиц .................................. 178 Приложение А. Список использованных признаков для стилометрического анализа армянских текстов. .... 181 Приложение Б. Результаты экспериментов по определению качества методов обнаружения границ нарушений стиля для случайного базового метода, Karas et al. и иерархической кластеризации (AC). ............ 184 Приложение В. Гиперпараметры нейронный сетей для нахождения и исправления ошибок автоматического распознавания армянских текстов. ............ 186 6 Введение Определение степени уникальности работ является одной из самых серьез- ных проблем в научных исследованиях. Неуникальные, заимствованные работы (заимствованием считается как правильно процитированный текст, так и текст без указания оригинального автора), которые остаются нераскрытыми, могут иметь серьезные негативные последствия по нескольким причинам. Заимствованные исследовательские работы препятствует научному процес- су, например, искажая механизмы отслеживания и исправления результатов [1]. Если исследователи расширят или пересмотрят более ранние результаты в после- дующих исследованиях, то статьи, содержащие заимствования из исходной ста- тьи, останутся неизменными. Неправильные результаты могут распространиться и повлиять на последующие исследования или практическое применение [2]. Ис- следования показывают, что некоторые частично или полностью заимствованные работы цитируются по крайней мере так же часто, как и оригинал. Это пробле- матично, поскольку число цитирований является широко используемым показа- телем эффективности исследований, например, для принятия решений о финан- сировании или найме. Отсутствие надежных механизмов выявления и предот- вращения случаев карьерного продвижения путем сплагиаченного труда может привести к кризисным ситуациям в различных отраслях общественной жизни (в образовательной 1 2 и судебной3 системах, например). С образовательной точки зрения заимствования наносят ущерб приобретению и оценке компетенций. Бы- ло выявлено, что учащиеся армянских вузов в целом осведомлены, какие имен- но действия считаются плагиатом, но продолжают их совершать из-за отсутствия мер пресечения [3]. Кроме того, заимствованные работы тратят ресурсы. В Герма- нии в рамках краудсорсингового проекта VroniPlag 4 было расследовано более 200 случаев предполагаемого академического плагиата (по состоянию на июль 2019 года). Опыт VroniPlag, а также других [4], показывает, что расследования уни- кальности работа часто требуют сотен рабочих часов от затронутых учреждений, 1https://ru.armeniasputnik.am/society/20190821/20137912/Epopeya-s-AGEU-zakonchilas-molodoy-io-rektora-Ruben- Ayrapetyan-pokinet-svoy-post-.html 2https://ru.armeniasputnik.am/society/20200525/23163731/Esli-moy-zam-pokryvaet-plagiat-dissertatsii-on-dolzhen- otvetit—-Araik-Arutyunyan-.html 3https://news.am/rus/news/514896.html 4http://www.vroniplag.de/ 7 и поэтому очень важно наличие автоматической системы обнаружения заимство- ваний, с помощью которой можно будет сократить затраты. Быстрое развитие информационных технологий, особенно Интернета, сде- лало заимствование работ легче, чем когда-либо. В 2015 году было проведено исследование образовательной политики Армении в направлении усиления ака- демической добросовестности, которое подтвердило, что незаконные заимство- вания в курсовых, бакалаврских и магистерских работах являются одним из са- мых распространенных нарушений [5]. Заимствованием, кроме дословного копи- рования, считается сокрытие заимствований путем перефразирования и перевода. Уникальность работы искусственно увеличивают также с помощью технических приемов, которые используют слабые места методов извлечения текста системы обнаружения заимствований и меняют исходный документ таким образом, чтобы его текст визуально не менялся, но доля обнаруженных заимствований получа- лась маленькой. Исследование и разработка методов выявления заимствований сейчас явля- ется довольно популярной, если судить по количеству опубликованных статей в последние годы [1]. Тем не менее, для многих языков не существует специализи- рованной системы обнаружения заимствований. В таких случаях приходится при- бегать к использованию инструментов, не адаптированных к определенному язы- ку, однако эти решения как правило не учитывают особенности языка и не пока- зывают достаточный уровень качества обработки. Обнаружению заимствований для армянского языка посвящена работа Томеян и др.[6]. Система, предложенная в работе Томеян и др., позволяет пользователю находить случаи замены омогли- фов, а также заимствования путем прямого копирования в коллекции, загружен- ной пользователем. Система также предоставляет опцию поиска заимствований с заменой синонимов, однако для ее работы пользователь должен сам заполнять список синонимов в системе перед проверкой. В работе делается попытка исполь- зования машинного перевода для обнаружения заимствований из других языков, но описанный механизм работы не до конца автоматизирован и требует ручное добавление переведенных текстов. Из-за отсутствия экспериментов невозможно делать выводы о качестве и производительности данной системы. Помимо Томе- ян и др., собственную систему обнаружения заимствований имеет ВАК РА. Обе системы не предусматривают поиск
Recommended publications
  • Glossaries of Words 30 1
    ENG L I SH ARABI C P ERSI AN TU RK I SH ARM EN I AN K U RD I SH SY RI AC by the G eog rap hical Section of the Na z al 1a112 67206 " D vision N val St miralt i , a qfi , A d y LONDON PUBLI SHED BY ms M AJ ESTY ’S ST ION ERY FFICE AT O . To b e p urc h ased t h rough any B ookse lle r or d ire c t ly f rom E . S TI NERY FFICE a t h e f ollowi n ad d r sse M . TA O O t g e s I M P I AL HOU KI G WA D W 2 an Y LO O C . d ER SE , N S , N N , . , 28 A B I N D O N S T T N D W G E L O O N S. l R E , , . ; 37 P ETER STREET M ANCH ESTER ; ’ 1 ST. D W éRESCEN T CA D I F F AN RE S , R ; 23 F ORTH S T T E D I B U G H REE , N R ; or from E S ST EET D B LI . P N NBY LTD 116 G AFTO U O O , R N R , N 19 2 0 Print ed und e r t h e afith ority of ’ H rs M AJ ESTY S STATI O NERY OF F I CE B F D I CK H AL L at t h e U nive sit P re ss Ox ford .
    [Show full text]
  • Optimal Interleaving: Serial Phonology-Morphology Interaction in a Constraint-Based Model
    OPTIMAL INTERLEAVING: SERIAL PHONOLOGY-MORPHOLOGY INTERACTION IN A CONSTRAINT-BASED MODEL A Dissertation Presented by MATTHEW ADAM WOLF Submitted to the Graduate School of the University of Massachusetts Amherst in partial fulfillment of the requirements for the degree of DOCTOR OF PHILOSOPHY September 2008 Department of Linguistics © Copyright by Matthew Adam Wolf 2008 All Rights Reserved OPTIMAL INTERLEAVING: SERIAL PHONOLOGY-MORPHOLOGY INTERACTION IN A CONSTRAINT-BASED MODEL A Dissertation Presented by MATTHEW A. WOLF Approved as to style and content by: ____________________________________ John J. McCarthy, Chair ____________________________________ Joseph V. Pater, Member ____________________________________ Elisabeth O. Selkirk, Member ____________________________________ Mark H. Feinstein, Member ___________________________________ Elisabeth O. Selkirk, Head Department of Linguistics ACKNOWLEDGEMENTS I’ve learned from my own habits over the years that the acknowledgements are likely to be the most-read part of any dissertation. It is therefore with a degree of trepidation that I set down these words of thanks, knowing that any omissions or infelicities I might commit will be a source of amusement for who-knows-how-many future generations of first-year graduate students. So while I’ll make an effort to avoid cliché, falling into it will sometimes be inevitable—for example, when I say (as I must, for it is true) that this work could never have been completed without the help of my advisor, John McCarthy. John’s willingness to patiently hear out half-baked ideas, his encyclopedic knowledge of the phonology literature, his almost unbelievably thorough critical eye, and his dogged insistence on making the vague explicit have made this dissertation far better, and far better presented, than I could have hoped to achieve on my own.
    [Show full text]
  • Al-Hadl Yahya B. Ai-Husayn: an Introduction, Newly Edited Text and Translation with Detailed Annotation
    Durham E-Theses Ghayat al-amani and the life and times of al-Hadi Yahya b. al-Husayn: an introduction, newly edited text and translation with detailed annotation Eagle, A.B.D.R. How to cite: Eagle, A.B.D.R. (1990) Ghayat al-amani and the life and times of al-Hadi Yahya b. al-Husayn: an introduction, newly edited text and translation with detailed annotation, Durham theses, Durham University. Available at Durham E-Theses Online: http://etheses.dur.ac.uk/6185/ Use policy The full-text may be used and/or reproduced, and given to third parties in any format or medium, without prior permission or charge, for personal research or study, educational, or not-for-prot purposes provided that: • a full bibliographic reference is made to the original source • a link is made to the metadata record in Durham E-Theses • the full-text is not changed in any way The full-text must not be sold in any format or medium without the formal permission of the copyright holders. Please consult the full Durham E-Theses policy for further details. Academic Support Oce, Durham University, University Oce, Old Elvet, Durham DH1 3HP e-mail: [email protected] Tel: +44 0191 334 6107 http://etheses.dur.ac.uk 2 ABSTRACT Eagle, A.B.D.R. M.Litt., University of Durham. 1990. " Ghayat al-amahr and the life and times of al-Hadf Yahya b. al-Husayn: an introduction, newly edited text and translation with detailed annotation. " The thesis is anchored upon a text extracted from an important 11th / 17th century Yemeni historical work.
    [Show full text]
  • In PDF Format, Please Click Here
    Deprivatio of Existence The use of Disguised Legalization as a Policy to Seize Property by Successive Governments of Syria A special report sheds light on discrimination projects aiming at radical demographic changes in areas historically populated by Kurds Acknowledgment and Gratitude The present report is the result of a joint cooperation that extended from 2018’s second half until August 2020, and it could not have been produced without the invaluable assistance of witnesses and victims who had the courage to provide us with official doc- uments proving ownership of their seized property. This report is to be added to researches, books, articles and efforts made to address the subject therein over the past decades, by Syrian/Kurdish human rights organizations, Deprivatio of Existence individuals, male and female researchers and parties of the Kurdish movement in Syria. Syrians for Truth and Justice (STJ) would like to thank all researchers who contributed to documenting and recording testimonies together with the editors who worked hard to produce this first edition, which is open for amendments and updates if new credible information is made available. To give feedback or send corrections or any additional documents supporting any part of this report, please contact us on [email protected] About Syrians for Truth and Justice (STJ) STJ started as a humble project to tell the stories of Syrians experiencing enforced disap- pearances and torture, it grew into an established organization committed to unveiling human rights violations of all sorts committed by all parties to the conflict. Convinced that the diversity that has historically defined Syria is a wealth, our team of researchers and volunteers works with dedication at uncovering human rights violations committed in Syria, regardless of their perpetrator and victims, in order to promote inclusiveness and ensure that all Syrians are represented, and their rights fulfilled.
    [Show full text]
  • How Children Learn to Write Words
    How Children Learn to Write Words How Children Learn to Write Words Rebecca TReiman and bReTT KessleR 1 3 Oxford University Press is a department of the University of Oxford. It furthers the University’s objective of excellence in research, scholarship, and education by publishing worldwide. Oxford New York Auckland Cape Town Dar es Salaam Hong Kong Karachi Kuala Lumpur Madrid Melbourne Mexico City Nairobi New Delhi Shanghai Taipei Toronto With offices in Argentina Austria Brazil Chile Czech Republic France Greece Guatemala Hungary Italy Japan Poland Portugal Singapore South Korea Switzerland Thailand Turkey Ukraine Vietnam Oxford is a registered trademark of Oxford University Press in the UK and certain other countries. Published in the United States of America by Oxford University Press 198 Madison Avenue, New York, NY 10016 © Oxford University Press 2014 All rights reserved. No part of this publication may be reproduced, stored in a retrieval system, or transmitted, in any form or by any means, without the prior permission in writing of Oxford University Press, or as expressly permitted by law, by license, or under terms agreed with the appropriate reproduction rights organization. Inquiries concerning reproduction outside the scope of the above should be sent to the Rights Department, Oxford University Press, at the address above. You must not circulate this work in any other form and you must impose this same condition on any acquirer. A copy of this book’s Catalog-in-Publication Data is on file with the Library of Congress ISBN 978–0–19–990797–7
    [Show full text]
  • Armenian Range: 0530–058F
    Armenian Range: 0530–058F This file contains an excerpt from the character code tables and list of character names for The Unicode Standard, Version 14.0 This file may be changed at any time without notice to reflect errata or other updates to the Unicode Standard. See https://www.unicode.org/errata/ for an up-to-date list of errata. See https://www.unicode.org/charts/ for access to a complete list of the latest character code charts. See https://www.unicode.org/charts/PDF/Unicode-14.0/ for charts showing only the characters added in Unicode 14.0. See https://www.unicode.org/Public/14.0.0/charts/ for a complete archived file of character code charts for Unicode 14.0. Disclaimer These charts are provided as the online reference to the character contents of the Unicode Standard, Version 14.0 but do not provide all the information needed to fully support individual scripts using the Unicode Standard. For a complete understanding of the use of the characters contained in this file, please consult the appropriate sections of The Unicode Standard, Version 14.0, online at https://www.unicode.org/versions/Unicode14.0.0/, as well as Unicode Standard Annexes #9, #11, #14, #15, #24, #29, #31, #34, #38, #41, #42, #44, #45, and #50, the other Unicode Technical Reports and Standards, and the Unicode Character Database, which are available online. See https://www.unicode.org/ucd/ and https://www.unicode.org/reports/ A thorough understanding of the information contained in these additional sources is required for a successful implementation.
    [Show full text]
  • Exploring Reproductive Roles and Attitudes in Saudi Arabia Azizah Linjawi
    Florida State University Libraries Electronic Theses, Treatises and Dissertations The Graduate School 2005 Exploring Reproductive Roles and Attitudes in Saudi Arabia Azizah Linjawi Follow this and additional works at the FSU Digital Library. For more information, please contact [email protected] THE FLORIDA STATE UNIVERSITY COLLEGE OF SOCIAL SCIENCES EXPLORING REPRODUCTIVE ROLES AND ATTITUDES IN SAUDI ARABIA By AZIZAH LINJAWI A Dissertation submitted to the Department of Sociology in partial fulfillment of the requirements for the degree of Doctor of Philosophy Degree awarded: Fall semester 2005 The members of the committee approve the dissertation of Azizah Linjawi defended on August 4th 2005: _____________________________________ Elwood Carlson Professor Directing Dissertation _____________________________________ Rebecca Miles Outside Committee Member ____________________________________ Graham Kinloch Committee Member ____________________________________ Isaac Eberstein Committee Member Approved: ______________________________________ Patricia Martin (Chair - Sociology) ______________________________________ Graham Kinloch (College of Social Sciences) The office of Graduate studies has verified and approved the above named committee members. ii ACKNOWLEDGEMENT Praise be to almighty Allah, the most merciful one, for his blessings to me which enabled me to finish my study at FSU. I write this acknowledgement with special gratitude and thanks to my Professor Elwood Carlson for his great teaching and his unlimited patience. I really appreciate his commitment to teaching me and imparting knowledge and encouragement. I have great respect for him. I would like to express my deepest appreciation to Professor Isaac Eberstein for his tremendous encouragement and advisement. I also wish to convey much thanks to Professor Rebecca Miles for sharing with me her own experience in research related to the Arab world along with always willing to teach.
    [Show full text]
  • “Peran Organisasi Islam Dalam Pengembangan Dan Penerapan Hukum Islam Di Indonesia” Sri Sultarini Rahayu & Riska Angriani
    “Peran Organisasi Islam Dalam Pengembangan dan Penerapan Hukum Islam di Indonesia” Sri Sultarini Rahayu & Riska Angriani BAB I PENDAHULUAN 1.1. Latar Belakang Indonesia adalah negara muslim terbesar di dunia, disusul secara berturut- turut oleh Pakistan, India, Bangladesh dan Turki. Sebagai negara muslim terbesar, Indonesia memiliki peranan penting di dunia Islam sehingga posisinya cukup diperhitungkan. Munculnya Indonesia sebagai kekuatan baru di dunia Internasional juga didukung oleh realitas sejarah yang dibuktikan dengan munculnya ormas-ormas Islam di Indonesia yang sebagian besar telah ada bahkan sebelum Indonesia merdeka. Sejarah ormas Islam sangat panjang. Mereka hadir melintasi berbagai zaman: sejak masa kolonialisme Belanda, penjajahan Jepang, pasca-kemerdekaan Orde Lama, era pembangunan Orde Baru, dan masa demokrasi Reformasi sekarang ini. Dalam lintasan zaman yang terus berubah itu, satu hal yang pasti, ormas-ormas Islam telah memberikan kontribusi besar bagi kejayaan Islam di Indonesia. Dinamika hukum Islam di Indonesia tidak lepas dari peran dan kontribusi ormas-ormas Islam dalam mendorong pengembangan dan penerapannya. Hukum Islam telah mengalami perkembangan yang pesat berkat peran ormas Islam yang diaktualisasikan melalui kegiatan di berbagi bidang, seperti bidang pendidikan, kesehatan hingga politik. Oleh karena itu, melalui makalah ini, kami akan membahas lebih lanjut mengenai peran organisasi-organisasi Islam dalam pengembangan dan penerapan hukum Islam di Indonesia. BAB II PEMBAHASAN 2.1. Pengertian Ormas Islam Organisasi
    [Show full text]
  • Thesis Draft 8 with Corrections
    Fuṣḥá, ‘āmmīyah, or both?: Towards a theoretical framework for written Cairene Arabic Saussan Khalil Submitted in accordance with the requirements for the degree of Doctor of Philosophy The University of Leeds Arabic, Islamic and Middle Eastern Studies School of Languages, Cultures and Societies September 2018 - !ii - I confirm that the work submitted is my own and that appropriate credit has been given where reference has been made to the work of others. This copy has been supplied on the understanding that it is copyright material and that no quotation from the thesis may be published without proper acknowledgement. The right of Saussan Khalil to be identified as Author of this work has been asserted by her in accordance with the Copyright, Designs and Patents Act 1988. © 2018 The University of Leeds and Saussan Khalil - iii! - Acknowledgements I would like to firstly thank my supervisor, Professor James Dickins for his support and encouragement throughout this study, and his endless patience and advice in guiding me on this journey. From the University of Leeds, I would like to thank Mrs Karen Priestley for her invaluable support and assistance with all administrative matters, however great or small. From the University of Cambridge, I would like to thank my colleagues Professor Amira Bennison, Dr Rachael Harris and Mrs Farida El-Keiy for their encouragement and allowing me to take the time to complete this study. I would also like to thank Dr Barry Heselwood, Professor Rex Smith, Dr Marco Santello and Dr Serge Sharoff for their input and guidance on specific topics and relevant research areas to this study.
    [Show full text]
  • N5020 2019-01-11
    ISO/IEC JTC 1/SC 2 N____ ISO/IEC JTC 1/SC 2/WG 2 N5020 2019-01-11 ISO/IEC JTC 1/SC 2/WG 2 Universal Coded Character Set (UCS) - ISO/IEC 10646 Secretariat: ANSI DOC TYPE: Meeting minutes TITLE: Unconfirmed minutes of WG 2 meeting 67 SOAS University of London, London, UK; 2018-06-16/20 SOURCE: V.S. Umamaheswaran ([email protected]), Recording Secretary Michel Suignard ([email protected]), Convener PROJECT: JTC 1.02.18 - ISO/IEC 10646 STATUS: SC 2/WG 2 participants are requested to review the attached unconfirmed minutes, act on appropriate noted action items, and to send any comments or corrections to the convener as soon as possible but no later than the due date below. ACTION ID: ACT DUE DATE: 2019-05-01 DISTRIBUTION: SC 2/WG 2 members and Liaison organizations MEDIUM: Acrobat PDF file NO. OF PAGES: 46 (including cover sheet) ISO International Organization for Standardization Organisation Internationale de Normalisation ISO/IEC JTC 1/SC 2/WG 2 Universal Coded Character Set (UCS) ISO/IEC JTC 1/SC 2 N____ ISO/IEC JTC 1/SC 2/WG 2 N5020 2019-01-11 Title: Unconfirmed minutes of WG 2 meeting 67 SOAS University of London, London, UK; 2018-06-16/20 Source: V.S. Umamaheswaran ([email protected]), Recording Secretary Michel Suignard ([email protected]), Convener Action: WG 2 members and Liaison organizations Distribution: ISO/IEC JTC 1/SC 2/WG 2 members and liaison organizations 1 Opening Input document: 4950 Agenda for the 67th Meeting of ISO/IEC JTC 1/SC2/WG2, SOAS, London, U.K.
    [Show full text]
  • Doing Business Guide 2021: Understanding Saudi Arabia's Tax Position
    Doing business guide 2021 Understanding Saudi Arabia’s tax position Doing business guide | Understanding Saudi Arabia’s tax position Equam ipsamen 01 Impos is enditio rendae acea 02 Debisinulpa sequidempos 03 Imo verunt illia 04 Asus eserciamus 05 Desequidellor ad et 06 Ivolupta dolor sundus et rem 07 Limporpos eum sequas as 08 Ocomniendae dit ulparcia dolori 09 Aquia voluptas seque 10 Dolorit ellaborem rest mi 11 Foccaes in nulpa arumquis 12 02 Doing business guide | Understanding Saudi Arabia’s tax position Contents 04 About the Kingdom of Saudi Arabia 06 Market overview 08 Industries of opportunity 10 Entering the market 03 Doing business guide | Understanding Saudi Arabia’s tax position About the Kingdom of Saudi Arabia The Kingdom" of Saudi A country located in the Arabian Peninsula, Throughout this guide, we have provided the Kingdom of Saudi Arabia (KSA, Saudi our comments with respect to KSA, unless Arabia is the largest Arabia or The Kingdom) is the largest oil- noted otherwise. oil-producing country producing country in the world. in the world Government type Monarchy " Population (2019) 34.2 million GDP (2019) US$ 793 billion GDP growth (2019) 0.33% Inflation (2019) -2.09% Labor force (2019) 14.38 million Crude oil production, petroleum refining, basic petrochemicals, ammonia, Key industries industrial gases, sodium hydroxide (caustic soda), cement, fertilizer, plastics, metals, commercial ship repair, commercial aircraft repair, construction Source: World Bank, General Authority of Statistics 04 Doing business guide | Understanding Saudi Arabia’s tax position 05 Doing business guide | Understanding Saudi Arabia’s tax position Market overview • Saudi Arabia is an oil-based economy Government with the largest proven crude oil reserves Government type Monarchy in the world.
    [Show full text]
  • Armenian Phonetic Characters in Unicode∗
    Armenian Phonetic Characters in Unicode∗ Luc V. Baronian, PhD Visiting Scholar, Stanford Associate Professor, UQAC January 19, 2017 1 Introduction Armenian has a relatively small number of speakers, yet it has a sesquimillennial written tradition and several contemporary academic publications. The numeric disadvantage, combined with the existence of two standard versions of the modern language (Eastern and Western), a unique alphabet and the evolution of Armenia's universities in the sphere of Russia, rather than that of Western Europe and North America, have all contributed to a poorer knowledge of its language and its academic achievements in the West than it deserves. For example, there exists an Armenian linguistic tradition, which, like the American, French and other linguistic traditions, has used a phonetic alphabet of its own for about a century, but based on the Armenian alphabet. The works of Hrach'ya Acharyan1 were crucial in disseminating the use of this phonetic alphabet still in use today among Armenian scholars. 2 The characters proposed for inclusion in Unicode While most of the Armenian phonetic characters consist of Armenian letters with or without the use of diacritics such as the umlaut or a combining ring, I have identified two characters that cannot be represented in the current state of Unicode. The first character consists of ARMENIAN SMALL LETTER AYB (U+0561, ) rotated 180 degrees. The letter could sometimes be confused for a LATIN SMALL LETTER M (U+006D); however, in those Armenian fonts that use square angles for Ayb, the difference is noticeable. Even a rotated curvy Ayb may look different from an m, especially in the rendition of the initial m-stroke (final Ayb-stroke).
    [Show full text]