урок кодирование текстовой информации 10 класс
Информатика. 10 класс
Конспект урока
Информатика, 10 класс. Урок № 14.
Тема — Кодирование текстовой информации
Цели и задачи урока:
— познакомиться со способами кодирования и декодирования текстовой информации с помощью кодовых таблиц и компьютера;
— познакомиться со способом определения информационного объема текстового сообщения;
— познакомиться с алгоритмом Хаффмана.
Вся информация в компьютере хранится в двоичном коде. Поэтому надо научиться преобразовывать символы в двоичный код.
Формула Хартли определяет количество информации в зависимости от количества возможных вариантов:
N — это количество вариантов,
i — это количество бит, не обходимых для кодирования.
Если же мы преобразуем эту формулу и примем за N — количество символов в используемом алфавите (назовем это мощностью алфавита), то мы поймем, сколько памяти потребуется для кодирования одного символа.
i — кол-во бит, потребуемых для кодирования
Итак, если в нашем алфавите будет присутствовать только 32 символа, то каждый из них займет только 5 бит.
И тогда каждому символу мы дадим уникальный двоичный код. Такую таблицу мы будем назвать кодировочной.
Первая широко используемая кодировочная таблица была создана в США и называлась ASCII, что в переводе означало American standard code for information interchange. Как вы видите, в таблице присутствуют не только латинские буквы, но и цифры, и даже действия. Каждому символу отводится 7 бит, а значит, всего было закодировано 128 символов.
Но так как этого количества было недостаточно, стали создаваться другие таблицы, в которых можно было закодировать и другие символы. Например, таблица Windows-1251, которая, по сути, являлась изменением таблицы ASCII, в которую добавили буквы кириллицы. Таких таблиц было создано множество: MS-DOS, КОИ-8, ISO, Mac и другие:
Проблема использования таких различных таблиц приводила к тому, что текст, написанный на одном компьютере, мог некорректно читаться на другом. Например:
Поэтому была разработана международная таблица кодировки Unicode, включающая в себя как символы английского, русского, немецкого, арабского и других языков. На каждый символ в такой таблице отводится 16 бит, то есть она позволяет кодировать 65536 символов. Однако использование такой таблицы сильно «утяжеляет» текст. Поэтому существуют различные алгоритмы неравномерной кодировки текста, например, алгоритм Хаффмана.
Идея алгоритма Хаффмана основана на частоте появления символа в последовательности. Символ, который встречается в последовательности чаще всего, получает новый очень маленький код, а символ, который встречается реже всего, получает, наоборот, очень длинный код.
Пусть нам дано сообщение aaabcbeeffaabfffedbac.
Чтобы узнать наиболее выгодный префиксный код для такого сообщения, надо узнать частоту появления каждого символа в сообщении.
Подсчитайте и внесите в таблицу частоту появления каждого символа в сообщении:
У вас должно получиться:
Расположите буквы в порядке возрастания их частоты.
Теперь возьмем два символа с наименьшей чистотой и представим их листьями в дереве, частота которого будет равна сумме частот этих листьев.
Символы d и c превращаются в ветку дерева:
Проделываем эти шаги до тех пор, пока не получится дерево, содержащее все символы.
Итак, сортируем таблицу:
Объединяем символ e и символ cd в ветку дерева:
Получился префиксный код. Теперь осталось расставить 1 и 0. Пусть каждая правая ветвь обозначает 1, а левая — 0.
Составляем код буквы, идя по ветке дерева от буквы к основанию дерева.
Тогда код для каждой буквы будет:
Закодируйте ASCII кодом слово MOSCOW.
Составим таблицу и поместим туда слово MOSCOW. Используя таблицу ASCII кодов, закодируем все буквы слова:
Урок информатики для 10 класса»Кодирование и обработка текстовой информации»
Новые аудиокурсы повышения квалификации для педагогов
Слушайте учебный материал в удобное для Вас время в любом месте
откроется в новом окне
Выдаем Удостоверение установленного образца:
Урок по теме «Кодирование текстовой информации»
Класс: 10
Учебник : Н.Д.Угринович, 10 класс. Информатика и ИКТ. БИНОМ. 2010
— рабочее место ученика, ПК;
— интерактивная доска, мультимедийный проектор;
— интерактивная презентация;
— таблица самооценки знаний, умений
— формировать знания учащихся по теме «Кодирование и обработка текстовой информации”;
— содействовать формированию у школьников образного мышления;
— развить навыки анализа и самоанализа;
— формировать умения планировать свою деятельность.
План урока:
Организационный момент (1 мин);
Проверка знаний, домашнего задания (7-8 мин);
Изучение нового материала (теоретическая часть) – (13 мин)
Закрепление изученного (практическая работа) – (15 мин);
Домашнее задание. (2 мин);
Подведение итогов (2 мин);
Ход урока
1. Организационный момент:
Приветствие, проверка присутствующих. Слайд 2. (Презентация)
2. Проверка знаний, домашнего задания
Слайд 3
— На прошлом уроке мы с вами повторили понятие информации, о роли информации в живой и неживой природе. Я предлагаю всем проверить свои знания с помощь теста. (Учащиеся проверяют знания, усвоение ключевых понятий предыдущей темы с помощью программы MyTest. Результаты тестирования сообщают учителю и записывают в таблицу самоконтроля) (Тест)
Тест
3. Изучение нового материала
Тема урока «Кодирование и обработка текстовой информации»
— Сегодня на уроке вы узнаете, как представляется текстовая информация в компьютере. Научитесь кодировать и декодировать текстовую информацию с помощью кодовых таблиц и ПК. Но для начала мы должны вспомнить, что же такое «кодирование»?
-Какой принцип кодирования информации используют в компьютере?
С развитием человечества появилась потребность обмениваться информацией. Но человеческий мозг не способен сохранять всю имеющуюся информацию. Так появилось гениальное изобретение – письменность. Возник набор условных обозначений для представления звуков, названный алфавитом. Алфавит мы сейчас рассматриваем как конечную совокупность символов, использующих для создания сообщений. Алфавит есть код человеческого языка. С созданием автоматических устройств возникла потребность создания таких языков, которые не имели бы множества толкований, т.е необходимо было формализовать человеческий язык. Огромное количество способов кодирования информации неизбежно привело пытливый человеческий ум к попыткам создать универсальный язык или азбуку для кодирования
Уже с 60-х годов прошлого столетия, компьютеры всё больше стали использовать для обработки текстовой информации. Для кодирования текстовой информации в компьютере применяется двоичное кодирование, т.е. представление текста в виде последовательности 0 и 1 (Эти два символа называются двоичными цифрами, по-английски – binary digit или сокращённо bit).
Почему же двоичное кодирование используется в вычислительной технике?
Оказывается такой способ легко реализовать технически: 1 – есть сигнал, 0 – нет сигнала. Каждому символу алфавита сопоставили определённое количество и последовательность нулей и единиц.
Сколько же бит необходимо для кодирования символов?
Ограничений на количество символов не существует. Однако есть количество, которое можно назвать достаточным.
Для количества такого количества символов достаточно 8 бит лил 1 байт. Итак, с помощью 1 байта можно закодировать 256 различных символов.
Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Т.О. человек различает символы по их начертанию, компьютер по их коду. При вводе в компьютер текстовой информации происходит двоичное кодирование, изображение символа преобразуется в двоичный код. Код символа хранится в одной ячейке оперативной памяти.
Первые 33 кода (с 0 по 33) этой таблице соответствует не символам, а операциям (ввод пробела, перевод строки и т.д.)
Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
Коды с 128 по 255 являются национальными, т.е. в разных национальных кодировках одному и тому же коду соответствуют различные символы. Существует 5 кодировочных таблиц для русских букв (Windows, MS-DOS, Mac, ISO, КОИ – 8). Поэтому тексты созданные в одной кодировке не будут правильно отображаться в другой
Информатика. 10 класс
Конспект урока
Информатика, 10 класс. Урок № 14.
Тема — Кодирование текстовой информации
Цели и задачи урока:
— познакомиться со способами кодирования и декодирования текстовой информации с помощью кодовых таблиц и компьютера;
— познакомиться со способом определения информационного объема текстового сообщения;
— познакомиться с алгоритмом Хаффмана.
Вся информация в компьютере хранится в двоичном коде. Поэтому надо научиться преобразовывать символы в двоичный код.
Формула Хартли определяет количество информации в зависимости от количества возможных вариантов:
N — это количество вариантов,
i — это количество бит, не обходимых для кодирования.
Если же мы преобразуем эту формулу и примем за N — количество символов в используемом алфавите (назовем это мощностью алфавита), то мы поймем, сколько памяти потребуется для кодирования одного символа.
i — кол-во бит, потребуемых для кодирования
Итак, если в нашем алфавите будет присутствовать только 32 символа, то каждый из них займет только 5 бит.
И тогда каждому символу мы дадим уникальный двоичный код. Такую таблицу мы будем назвать кодировочной.
Первая широко используемая кодировочная таблица была создана в США и называлась ASCII, что в переводе означало American standard code for information interchange. Как вы видите, в таблице присутствуют не только латинские буквы, но и цифры, и даже действия. Каждому символу отводится 7 бит, а значит, всего было закодировано 128 символов.
Но так как этого количества было недостаточно, стали создаваться другие таблицы, в которых можно было закодировать и другие символы. Например, таблица Windows-1251, которая, по сути, являлась изменением таблицы ASCII, в которую добавили буквы кириллицы. Таких таблиц было создано множество: MS-DOS, КОИ-8, ISO, Mac и другие:
Проблема использования таких различных таблиц приводила к тому, что текст, написанный на одном компьютере, мог некорректно читаться на другом. Например:
Поэтому была разработана международная таблица кодировки Unicode, включающая в себя как символы английского, русского, немецкого, арабского и других языков. На каждый символ в такой таблице отводится 16 бит, то есть она позволяет кодировать 65536 символов. Однако использование такой таблицы сильно «утяжеляет» текст. Поэтому существуют различные алгоритмы неравномерной кодировки текста, например, алгоритм Хаффмана.
Идея алгоритма Хаффмана основана на частоте появления символа в последовательности. Символ, который встречается в последовательности чаще всего, получает новый очень маленький код, а символ, который встречается реже всего, получает, наоборот, очень длинный код.
Пусть нам дано сообщение aaabcbeeffaabfffedbac.
Чтобы узнать наиболее выгодный префиксный код для такого сообщения, надо узнать частоту появления каждого символа в сообщении.
Подсчитайте и внесите в таблицу частоту появления каждого символа в сообщении:
У вас должно получиться:
Расположите буквы в порядке возрастания их частоты.
Теперь возьмем два символа с наименьшей чистотой и представим их листьями в дереве, частота которого будет равна сумме частот этих листьев.
Символы d и c превращаются в ветку дерева:
Проделываем эти шаги до тех пор, пока не получится дерево, содержащее все символы.
Итак, сортируем таблицу:
Объединяем символ e и символ cd в ветку дерева:
Получился префиксный код. Теперь осталось расставить 1 и 0. Пусть каждая правая ветвь обозначает 1, а левая — 0.
Составляем код буквы, идя по ветке дерева от буквы к основанию дерева.
Тогда код для каждой буквы будет:
Закодируйте ASCII кодом слово MOSCOW.
Составим таблицу и поместим туда слово MOSCOW. Используя таблицу ASCII кодов, закодируем все буквы слова:
Кодирование текстовой информации (10 класс)
Новые аудиокурсы повышения квалификации для педагогов
Слушайте учебный материал в удобное для Вас время в любом месте
откроется в новом окне
Выдаем Удостоверение установленного образца:
Выбранный для просмотра документ 2.doc
Конспект урока по учебнику «Информатика и ИКТ» 10 класс Н.Д. Угринович
Подготовила: учитель информатики Рыбалкина И.Г.
Тема урока: Кодирование текстовой информации. Инструктаж по ТБ. Практическая работа №1 «Кодировки русских букв»
Познакомить учащихся со способами кодирования информации в компьютере
Рассмотреть примеры решения задач
Используя активные формы работы на уроке, создать практически для каждого ученика ситуацию успеха
Воспитание познавательного интереса учащихся, умения слушать, культуры межличностных взаимоотношений.
Оборудование: доска, презентация
Оргмомент (проверка готовности учащихся к уроку, сообщение темы урока)
Актуализация и систематизация знаний. (Усный опрос)
Изучение нового материала.
С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса:
Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код.
Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.
Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.
Традиционно для кодирования одного символа используется количество информации = 1 байту (1 байт = 8 битов). Для кодирования одного символа требуется один байт информации.
Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов. (28=256)
Кодирование заключается в том, что каждому символу ставиться в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).
В настоящее время существуют пять различных кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO) поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой. Для разных типов ЭВМ используются различные таблицы кодировки. С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standart Code for Information Interchange) – американский стандартный код для информационного обмена.
Рисунок 1. Десятичные коды некоторых символов в различных кодировках
Стандартной в этой таблице является только первая половина, т.е. символы с номерами от 0 (00000000) до 127 (0111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.
Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита.
В последние годы получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ два байта. С его помощью можно закодировать 65536 (216= 65536 ) различных символов.
Закрепление изученного материала
Итог урока. Выставление
Ответить на вопросы (в скобках ответ на вопрос).
Какой принцип кодирования текстовой информации используется в компьютере? (используется двоичный принцип кодирования информации, используют 0 и 1, для кодирования одного символа используется 1 байт информации = 8 битам);
Почему при кодировании текстовой информации в компьютере в большинстве кодировок используется 256 различных символов, хотя русский алфавит включает только 33 буквы? (Текстовая информация (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) содержит 256 различных знаков.);
Как называется международная таблица кодировки символов?( ASCII);
С какой целью ввели кодировку Unicode, которая позволяет закодировать 65 536 различных символов? (чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты).
Выставление оценок за урок (за практическую работу за компьютером).
Домашнее задание. Конспект + стр.14 учебника
Учащимся дается индивидуальная карточка, в которой нужно подчеркнуть фразы, характеризующие работу ученика на уроке по трем направлениям.