система классификации и кодирования это
Системы классификации и кодирования информации
Классификаторы представляют собой систематический свод, перечень каких-либо объектов, позволяющий находить каждому их них свое место, и имеют определенное (обычно числовое) обозначение. Система классификации позволяет сгруппировать объекты выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов — это процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.
В любой стране разработаны и применяются государственные, отраслевые, региональные классификаторы. Например, классифицированы: отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т.д.
Классификатор — систематизированный свод наименований и кодов классификационных группировок.
Назначение классификатора:
Разработаны три метода классификации объектов, которые различаются разной стратегией применения классификационных признаков.
Методы классификации объектов:
Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации. В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранного классификационного признака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии. Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.
В отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами (facet — рамка). Каждый фасет содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение. Схема построения фасетной системы классификации представляется в виде таблицы. Названия столбцов соответствуют выделенным классификационным признакам (фасетам). В каждой клетке таблицы хранится конкретное значение фасета. Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. Достоинства фасетной системы классификации: возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок; возможность простой модификации всей системы классификации без изменения структуры существующих группировок. Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.
Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.
Унифицированные системы документациисоздаются на государственном, республиканском, отраслевом и региональном уровнях. Главная цель — это обеспечение сопоставимости показателей различных сфер общественного производства. Разработаны стандарты, где устанавливаются требования:
Однако, несмотря на существование унифицированной системы документации, при обследовании большинства организаций постоянно выявляется целый комплекс типичных недостатков:
Поэтому устранение указанных недостатков является одной из задач, стоящих при создании информационного обеспечения.
Схемы информационных потоковотражают маршруты движения информации и ее объемы, места возникновения первичной информации и использования результатной информации. За счет анализа структуры подобных схем можно выработать меры по совершенствованию всей системы управления.
Построение схем информационных потоков, позволяющих выявить объемы информации и провести ее детальный анализ, обеспечивает:
При этом подробно должны рассматриваться вопросы взаимосвязи движения информации по уровням управления. Следует выявить, какие показатели необходимы для принятия управленческих решений, а какие нет. К каждому исполнителю должна поступать только та информация, которая используется.
Для создания информационного обеспечения необходимо:
—> Электронный кабинет преподавателя Емельяновой М.С.
СИСТЕМА КОДИРОВАНИЯ
Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.
Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:
§ длиной – число позиций в коде;
§ структурой – порядок расположения в коде символов, используемых для обозначения классификационного признака.
Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования (рис.2.7), которые образуют:
§ классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;
§ регистрационную систему кодирования, не требующую предварительной классификации объектов.
Рассмотрим представленную на рис. 2.7 систему кодирования.
Рис. 2.7. Система кодирования, использующая разные методы
Классификационное кодирование
Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.
Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.
Пример 2.15. Проведем кодирование информации, классифицированной с помощью иерархической схемы (см. рис. 2.4). Количество кодовых группировок будет определяться глубиной классификации и равно 4. Прежде чем начать кодирование, необходимо определиться с алфавитом, т.е. какие будут использоваться символы. Для большей наглядности выберем десятичную систему счисления – 10 арабских цифр. Анализ схемы на рис. 2.4 показывает, что длина кода определяется 4 десятичными разрядами, а кодирование группировки на каждом уровне можно делать путем последовательной нумерации слева направо. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:
1-й (старший) разряд выделен для классификационного признака «название факультета» и имеет следующие значения: 1 – коммерческий; 2 – информационные системы; 3 – для следующего названия факультета и т.д.;
2-й разряд выделен для классификационного признака «возраст» и имеет следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 – свыше 30 лет; 3-й разряд выделен для классификационного признака «пол» и имеет следующие значения: 1 – мужчины; 2 – женщины;
4-й разряд выделен для классификационного признака «наличие детей у женщин» и имеет следующие значения: 1 – есть дети; 2 – нет детей, 0 – для мужчин, так как подобной информации не требуется.
Принятая система кодирования позволяет легко расшифровать любой код группировки, например:
1310 – студенты коммерческого факультета, свыше 30 лет, мужчины; 2221 – студенты факультета информационных систем, от 20 до 30 лет, женщины, имеющие детей.
Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.
Пример 2.16. Проведем кодирование информации, классифицированной с помощью фасетной схемы (см. рис. 2.6). Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь длину кода, равную 4. В отличие от последовательного кодирования для иерархической системы классификации в данном методе не имеет значения порядок кодировки фасетов. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:
2-й разряд выделен для фасета «наличие детей у женщин» и имеет следующие значения: 1 – есть дети; 2 – нет детей, 0 – для мужчин, так как подобной информации не требуется;
3-й разряд выделен для фасета «возраст» и имеет следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 – свыше 30 лет;
4-й разряд выделен для фасета «название факультета» и имеет следующие значения: 1 – радиотехнический, 2 – машиностроительный, 3 – коммерческий; 4 – информационные системы; 5 – математический и т.д.
Принятая система кодирования позволяет легко расшифровать любой код группировки, например:
2135 – женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентами математического факультета;
1021 – мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета.
Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.
Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.
Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.
Пример 2.17. Все студенты одного факультета разбиваются на учебные группы (в данной терминологии – серии), для которых используется порядковая нумерация. Внутри каждой группы производится упорядочение фамилий студентов по алфавиту и каждому студенту присваивается номер.
КЛАССИФИКАЦИЯ ИНФОРМАЦИИ ПО РАЗНЫМ ПРИЗНАКАМ
Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.
На рис. 2.8 приведена одна из схем классификации циркулирующей в организации (фирме) информации. В основу классификации положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция управления.
Рис. 2.8. Классификация информации, циркулирующей в организации
Место возникновения. По этому признаку информацию можно разделить на входную, выходную, внутреннюю, внешнюю.
Входная информация – это информация, поступающая в фирму или ее подразделения.
Выходная информация – это информация, поступающая из фирмы в другую фирму, организацию (подразделение).
Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной. По отношению к объекту управления (фирма или ее подразделение: цех, отдел, лаборатория) информация может быть определена как внутренняя, так и внешняя.
Пример 2.18. Содержание указа правительства об изменении уровня взимаемых налогов для фирмы является, с одной стороны, внешней информацией, с другой стороны – входной. Сведения фирмы в налоговую инспекцию о размере отчислении в госбюджет являются, с одной стороны, выходной информацией, с другой стороны – внешней по отношению к налоговой инспекции.
Стадия обработки. По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.
Первичная информация – это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.
Вторичная информация – это информация, которая получается в результате обработки первичной информации и может быть промежуточной и результатной.
Промежуточная информация используется в качестве исходных данных для последующих расчетов.
Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.
Пример 2.19. В художественном цехе, где производится роспись чашек, в конце каждой смены регистрируется общее количество произведенной продукции и количество расписанных чашек каждым работником. Это первичная информация. В конце каждого месяца мастер подводит итоги первичной информации. Это будет, с одной стороны, вторичная промежуточная информация, а с другой стороны – результатная. Итоговые данные поступают в бухгалтерию, где производится расчет заработной платы каждого работника в зависимости от его выработки. Полученные расчетные данные – результатная информация.
Способ отображения. По способу отображения информация подразделяется на текстовую и графическую.
Текстовая информация – это совокупность алфавитных, цифровых и специальных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).
Графическая информация – это различного рода графики, диаграммы, схемы, рисунки и т.д.
Стабильность. По стабильности информация может быть переменной (текущей) и постоянной (условно-постоянной).
Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т.п.
Постоянная (условно-постоянная) информация – это неизменная и многократно используемая в течение длительного периода времени информация. Постоянная информация может быть справочной, нормативной, плановой:
§ постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков. Например, табельный номер служащего, профессия работника, номер цеха и т.п.;
§ постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы. Например, размер налога на прибыль, стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим;
§ постоянная плановая информация содержит многократно используемые в фирме плановые показатели. Например, план выпуска телевизоров, план подготовки специалистов определенной квалификации.
Плановая информация – информация о параметрах объекта управления на будущий период. На эту информацию идет ориентация всей деятельности фирмы.
Пример 2.20. Плановой информацией фирмы могут быть такие показатели, как план выпуска продукции, планируемая прибыль от реализации, ожидаемый спрос на продукцию и т.д.
Нормативно-справочная информация содержит различные нормативные и справочные данные. Ее обновление происходит достаточно редко.
Пример 2.21. Нормативно-справочной информацией на предприятии являются:
§ время, предназначенное для изготовления типовой детали (нормы трудоемкости);
§ среднедневная оплата рабочего по разряду;
§ адрес поставщика или покупателя и т.д.
Пример 2.22. Учетной информацией являются: количество проданной продукции за определенный период времени; среднесуточная загрузка или простой станков и т.п.
Оперативная (текущая) информация – это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности. От того, насколько быстро и качественно проводится ее обработка, во многом зависит успех фирмы на рынке.
Пример 2.23. Оперативной информацией являются:
§ количество изготовленных деталей за час, смену, день;
§ количество проданной продукции за день или определенный час;
§ объем сырья от поставщика на начало рабочего дня и т.д.
ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ
1. В чем различие информации и данных?
2. Что такое адекватность информации?
3. Какие существуют показатели качества информации?
4. Что такое система классификации информации?
5. Основные идеи иерархического, фасетного, дескрипторного методов классификации. Примеры.
6. Что такое система кодирования информации? Классификация методов.
7. Что такое классификационное, регистрационное кодирование? Примеры.
8. Сопоставьте назначения системы классификации и системы кодирования.
9. Расскажите о классификации информации, циркулирующей в организации.
ЛИТЕРАТУРА
Использован материал учебника «Информатика» Н.В.Макаровой
Система классификации и кодирования это
1.2. ОСНОВНЫЕ ПОНЯТИЯ, ИСПОЛЬЗУЕМЫЕ В ЕДИНОЙ СИСТЕМЕ КЛАССИФИКАЦИЙ
Для описания процессов классификации и кодирования технико-экономической и социальной информации, а также состава, структуры построения и наполнения общероссийских классификаторов, разработаны и применяются соответствующие основные понятия единой системы классификаций. С целью обеспечения однозначного понимания смыслового содержания основных и вспомогательных понятий и их единой трактовки для каждого из них разработаны и ниже приводятся соответствующие им терминологические определения и уточняющие в необходимых случаях текстовые пояснения.
Кроме того проводятся работы по семантической и терминологической поддержке классификаторов, заключающиеся в создании описаний и словарей терминов и понятий, используемых в классификаторах. Объем стандартизованных и рекомендуемых терминов и определений постоянно расширяется и совершенствуется.
Методы классификации должны обеспечивать систематизацию объектов классификации по определенным выбранным признакам, которыми могут быть: свойства, характеристики или параметры объектов. Количество значений признака определяет число образуемых классификационных группировок по этому признаку. Для классификации продукции используются, например, следующие признаки: отраслевая принадлежность, назначение, область применения, принцип действия, конструктивные особенности, используемый для изготовления способ и материал. В частности, в Общероссийском классификаторе продукции (ОКП) трубы стальные классифицируются по способу изготовления: тянутые, сварные, центробежнолитые, катаные; по назначению:водогазопроводные, нефтепроводные, подшипниковые, для котлов высокого давления, бурильные, насосно-компрессорные; по виду материала: нержавеющие, углеродистые, эмалированные; по размеру: диаметром 1020 мм, 1220 мм, 1420 мм и другие.
Для описания процесса классификации информации используются следующие термины и определения понятий.
Кодирование предназначено для формализованного описания заданного множества объектов, которое позволяет производить эффективную автоматизированную обработку информации. Для описания процесса кодирования информации используются следующие термины и определения понятий.
Для обеспечения организационно-методического единства предусмотрены следующие стадии разработки общероссийских классификаторов:
В зависимости от области применения и уровня принятия (утверждения) классификаторы подразделяются на следующие категории: общероссийские, отраслевые (ведомственные) и классификаторы предприятий.
По своему статусу классификаторы приравнены к соответствующим категориям стандартов.
Для описания состава, структуры и требований, предъявляемых к построению классификаторов, используются следующие термины и определения.
Общероссийские классификаторы разрабатываются в тех случаях, когда классификатор:
обеспечивает сопоставимость данных в различных областях и уровнях хозяйственной деятельности (межотраслевое применение);
обеспечивает гармонизацию с международным классификатором;
информационно связан с действующими общероссийскими классификаторами;
используется в общероссийских унифицированных формах документов.
Отраслевые классификаторы разрабатываются в тех случаях, когда они включают информацию, содержащуюся в унифицированных отраслевых формах документов, отсутствующую в общероссийских классификаторах или представляющую собой выборки из общероссийских классификаторов, в которых допускается дополнение отсутствующими в них объектами и (или) признаками классификации.
Порядок разработки, принятия, учета, ведения, опубликования и применения отраслевых (ведомственных) классификаторов устанавливают министерства, ведомства.
Классификаторы предприятий разрабатываются в тех случаях, когда они включают информацию, содержащуюся в унифицированных формах документов предприятий, отсутствующую в общероссийских и (или) отраслевых классификаторах, в которых допускается дополнение отсутствующими в них объектами и (или) признаками классификации.
Порядок разработки, принятия, учета, ведения, опубликования и применения классификаторов предприятий устанавливают сами предприятия.
Применение международных классификаторов обеспечивается путем полного или частичного включения их содержания в отечественные классификаторы, либо путем разработки переходных ключей.
Гармонизация классификаторов достигается путем группирования экономико-статистических данных при разработке национальных классификаторов в соответствии с международными классификаторами. Отражение национальных особенностей стран осуществляется по установленным международными организациями правилам или рекомендациям.
Для установления взаимного соответствия содержания группировок национальных и международных классификаторов разрабатываются переходные ключи (перекодировочные таблицы).
В переходных ключах содержится информация о том, каким позициям (кодам) национального классификатора соответствуют коды международного классификатора и наоборот. Вследствие использования зачастую в классификаторах разных признаков классификации, увязка кодов не всегда является однозначной. В этих случаях в переходных ключах приводится поясняющая информация, дающая описание » входимости» объектов информации.
Ведение классификатора заключается во внесении в него изменений, касающихся включения, аннулирования или изменения содержащихся в нем кодов, группировок или иной информации, являющейся его частью.
Изменения могут вноситься во введение к классификатору, в алфавитно-предметный указатель, в приложения, в пояснения, раскрывающие содержание группировок, в определения категорий, используемых в классификаторе.
Изменения основываются на законодательных и нормативных актах, разрабатываемых органами государственной власти и управления Российской Федерации, отечественных, зарубежных и международных стандартах, документах директивного характера, межведомственных системах документации.
Изменения по общероссийским классификаторам технико-экономической и социальной информации разрабатываются министерствами, ведомствами Российской Федерации, ответственными за ведение соответствующих классификаторов. Проекты изменений к общероссийским классификаторам утверждаются по поручению Госстандарта России Всероссийским научно-исследовательским институтом классификации, терминологии и информации по стандартизации и качеству (ВНИИКИ) Госстандарта России.
Информационное обслуживание пользователей изменениями по общероссийским классификаторам осуществляется ВНИИКИ Госстандарта России, Вычислительным центром Госкомстата России и организациями, на которые министерствами и ведомствами возложены эти функции.
Общероссийские классификаторы в зависимости от их состава, содержания и назначения применяются в статистике, финансовой и банковской деятельности, таможенном деле, стандартизации и других сферах экономики.
Применение кодов и наименований группировок общероссийских классификаторов осуществляется в межведомственных формах документов, входящих в следующие унифицированные системы документации: организационно-распорядительную; банковскую; финансовую, учетную и отчетную бухгалтерскую документацию бюджетных учреждений и организаций; отчетно-статистическую; учетную и отчетную бухгалтерскую документацию предприятий; документацию по труду; документацию Пенсионного фонда Российской Федерации; внешнеторговую документацию.
Систематизированные в классификаторах виды объектов технико-экономической и социальной информации используются для организации информационных фондов и баз данных в государственных и негосударственных информационных системах на федеральном и региональном уровнях, а также на уровне местного самоуправления.
В государственной статистике классификаторы служат метаинформационной основой ЕГРПО, а также используются для разработки данных при проведении федерального государственного статистического наблюдения.
В государственной статистике используется как система нормативно-справочного обеспечения комплексов электронной обработки экономико-статистической информации; для решения задач, связанных с формированием регистров, реестров, кадастров, каталогов, сводно-группировочных таблиц, перечней однородных элементов данных. Обеспечивает актуализацию информации по классификаторам на федеральном уровне и в банках данных региональных органов государственной статистики.
АБК функционирует на базе информационно-вычислительной сети Госкомстата России с применением телекоммуникационных средств связи.
Методологические положения по статистике (выпуск 1,2,3,4,5)
Copyright © Федеральная служба государственной статистики