Язык и информация информатика
Содержание урока
Представление информации, языки, кодирование
Представление информации, языки, кодирование
Из курса основной школы вам известно: • Историческое развитие человека, формирование человеческого общества связано с развитием речи, с появлением и распространением языков. Язык — это знаковая система для представления и передачи информации. Письменность и кодирование информацииПод словом «кодирование» понимают процесс представления информации, удобный для ее хранения и/или передачи. Следовательно, запись текста на естественном языке можно рассматривать как способ кодирования речи с помощью графических элементов (букв, иероглифов). Записанный текст является кодом, заключающим в себе содержание речи, т. е. информацию. Процесс чтения текста — это обратный по отношению к письму процесс, при котором письменный текст преобразуется в устную речь. Чтение можно назвать декодированием письменного текста. Схематически эти два процесса изображены на рис. 1.1. Схема на рис. 1.1 типична для всех процессов, связанных с передачей информации. Цели и способы кодированияТеперь обратим внимание на то, что может существовать много способов кодирования одного и того же текста на одном и том же языке. Например, русский текст мы привыкли записывать с помощью русского алфавита. Но то же самое можно сделать, используя латинский алфавит. Иногда так приходится поступать, отправляя SMS по мобильному телефону, на котором нет русских букв, или электронное письмо на русском языке за границу, если у адресата нет русифицированного программного обеспечения. Например, фразу «Здравствуй, дорогой Саша!» приходится писать так: «Zdravstvui, dorogoi Sasha!». Существует множество способов кодирования. Например, стенография — быстрый способ записи устной речи. Стенография появилась во времена, когда не существовало техники звукозаписи. Ею владели лишь немногие специально обученные люди — стенографисты. Они успевали записывать текст синхронно с речью выступающего человека. В стенограмме один значок обозначает целое слово или сочетание букв. Расшифровать (декодировать) стенограмму мог только сам стенографист. Посмотрите на текст стенограммы на рис. 1.2. Там написано следующее: «Говорить умеют все люди на свете. Даже у самых примитивных племен есть речь. Язык — это нечто всеобщее и самое человеческое, что есть на свете». Можно придумать и другие способы кодирования. Приведенные примеры иллюстрируют следующее важное правило: для кодирования одной и той же информации могут быть использованы разные способы; их выбор зависит от ряда обстоятельств: цели кодирования, условий, имеющихся средств. Если надо записать текст в темпе речи, делаем это с помощью стенографии; если надо передать текст за границу, пользуемся латинским алфавитом; если надо представить текст в виде, понятном для грамотного русского человека, записываем его по правилам грамматики русского языка. Еще одно важное обстоятельство: выбор способа кодирования информации может быть связан с предполагаемым способом ее обработки. Обсудим это на примере представления чисел — количественной информации. Используя русский алфавит, можно записать число «тридцать пять». Используя же алфавит арабской десятичной системы счисления, пишем: 35. Пусть вам надо произвести вычисления. Скажите, какая запись удобнее для выполнения расчетов: «тридцать пять умножить на сто двадцать семь» или «35 х 127»? Очевидно, что для перемножения многозначных чисел вы будете пользоваться второй записью. Заметим, что эти две записи, эквивалентные по смыслу, используют разные языки: первая — естественный русский язык, вторая — формальный язык математики, не имеющий национальной принадлежности. Переход от представления на естественном языке к представлению на формальном языке можно также рассматривать как кодирование. Человеку удобно использовать для кодирования чисел десятичную систему счисления, а компьютеру — двоичную систему. Широко используемыми в информатике формальными языками являются языки программирования. В некоторых случаях возникает потребность засекречивания текста сообщения или документа, для того чтобы его не смогли прочитать те, кому не положено. Это называется защитой от несанкционированного доступа. В таком случае секретный текст шифруется. В давние времена шифрование называлось тайнописью. Шифрование представляет собой процесс превращения открытого текста в зашифрованный, а дешифрование — процесс обратного преобразования, при котором восстанавливается исходный текст.
Следующая страница ЯзыкиОпределение и классификация языковЯзык — это определенная система символьного представления информации. В словаре по школьной информатике, составленном А.П. Ершовым [6], дано такое определение: “Язык — множество символов и совокупность правил, определяющих способы составления из этих символов осмысленных сообщений”. Поскольку под осмысленным сообщением понимается информация, то данное определение по сути своей совпадает с первым. Языки делятся на две группы: естественные и формальные. Естественные языки — это исторически сложившиеся языки национальной речи. Для большинства современных языков характерно наличие устной и письменной форм речи. Анализ естественных языков в большей степени является предметом филологических наук, в частности, лингвистики. В информатике анализом естественных языков занимаются специалисты в области искусственного интеллекта. Одна из целей разработки проекта ЭВМ пятого поколения — научить компьютер понимать естественные языки. Формальные языки — это искусственно созданные языки для профессионального применения. Они, как правило, носят международный характер и имеют письменную форму. Примерами таких языков являются язык математики, язык химических формул, нотная грамота — язык музыки и др. С любым языком связаны следующие понятия: алфавит — множество используемых символов; синтаксис — правила записи языковых конструкций (текста на языке); семантика — смысловая сторона языковых конструкций; прагматика — практические последствия применения текста на данном языке. Для формальных языков характерна принадлежность к ограниченной предметной области (математика, химия, музыка и пр.). Назначение формального языка — адекватное описание системы понятий и отношений, свойственных для данной предметной области. Поэтому все названные выше компоненты языка (алфавит, синтаксис и др.) ориентированы на специфику предметной области. Язык может развиваться, изменяться, дополняться вместе с развитием своей предметной области. Естественные языки не ограничены в своем применении, в этом смысле их можно назвать универсальными. Однако не всегда бывает удобным использовать только естественный язык в узкопрофессиональных областях. В таких случаях люди прибегают к помощи формальных языков. Известны примеры языков, находящихся в промежуточном состоянии между естественными и формальными. Язык эсперанто был создан искусственно для общения людей разных национальностей. А латынь, на которой в древности говорили жители Римской империи, в наше время стала формальным языком медицины и фармакологии, утратив функцию разговорного языка. Языки информатикиДалее речь пойдет о языках, используемых при работе ЭВМ, в компьютерных информационных технологиях. Информация, циркулирующая в компьютере, делится на два вида: обрабатываемая информация (данные) и информация, управляющая работой компьютера (команды, программы, операторы). Информацию, представленную в форме, пригодной для хранения, передачи и обработки компьютером, принято называть данными. Примеры данных: числа при решении математической задачи; символьные последовательности при обработке текстов; изображение, введенное в компьютер путем сканирования, предназначенное для обработки. Способ представления данных в компьютере называется языком представления данных. Для каждого типа данных различается внешнее и внутреннее представление данных. Внешнее представление ориентировано на человека, определяет вид данных на устройствах вывода: на экране, на распечатке. Внутреннее представление — это представление на носителях информации в компьютере, т.е. в памяти, в линиях передачи информации. Компьютер непосредственно оперирует с информацией во внутреннем представлении, а внешнее представление используется для связи с человеком. В самом общем смысле можно сказать, что языком представления данных ЭВМ является язык двоичных кодов. Однако с точки зрения приведенных выше свойств, которыми должен обладать всякий язык: алфавита, синтаксиса, семантики, прагматики, — нельзя говорить об одном общем языке двоичных кодов. Общим в нем является лишь двоичный алфавит: 0 и 1. Но для различных типов данных различаются правила синтаксиса и семантики языка внутреннего представления. Одна и та же последовательность двоичных цифр для разных типов данных имеет совсем разный смысл. Например, двоичный код “0100000100101011” на языке представления целых чисел обозначает десятичное число 16 683, а на языке представления символьных данных обозначает два символа — “А+”. Таким образом, для разных типов данных используются разные языки внутреннего представления. Все они имеют двоичный алфавит, но различаются интерпретацией символьных последовательностей. Языки внешнего представления данных обычно приближены к привычной для человека форме: числа представляются в десятичной системе, при записи текстов используются алфавиты естественных языков, традиционная математическая символика и пр. В представлении структур данных используется удобная табличная форма (реляционные базы данных). Но и в этом случае всегда существуют определенные правила синтаксиса и семантики языка, применяется ограниченное множество допустимых символов. Внутренним языком представления действий над данными (языком управления работой компьютера) является командный язык процессора ЭВМ. К внешним языкам представления действий над данными относятся языки программирования высокого уровня, входные языки пакетов прикладных программ, командные языки операционных систем, языки манипулирования данными в СУБД и пр. Любой язык программирования высокого уровня включает в себя как средства представления данных — раздел данных, так и средства представления действий над данными — раздел операторов (см. “Языки программирования” ). То же самое относится и к другим перечисленным выше типам компьютерных языков. Среди формальных языков науки наиболее близким к информатике является язык математики. Методические рекомендацииВ пропедевтическом и базовом курсах информатики большое образовательное значение имеет разговор о языках применительно к человеку. Знакомый ученикам термин “язык” приобретает новый смысл в их сознании. Вокруг этого термина строится целая система научных понятий. Понятие языка является одним из важнейших системообразующих понятий курса информатики. Изучая каждое новое средство ИКТ, следует обращать внимание учеников на то, что для работы с ним пользователь должен овладеть определенным формализованным языком, что его использование требует строгого соблюдения правил языка: знания алфавита, синтаксиса, семантики и прагматики. Такая строгость связана с тем, что формализованные языки, как правило, не обладают избыточностью. Поэтому любое нарушение правил (использование символа, не входящего в алфавит, неправильное употребление разделительных знаков, например, запятой вместо точки и т.п.) приводит к ошибке. Следует обращать внимание учеников на общность некоторых языковых конструкций, используемых в различных технологиях. Например, правила записи формул в электронных таблицах и арифметических выражений в языках программирования практически одинаковы. Существуют и различия, на которые тоже следует обращать внимание. Например, в языках программирования логические связки (NOT, AND, OR) являются знаками операций, а в электронных таблицах — именами функций. Для упрощения работы пользователя в современном программном обеспечении часто применяются различного рода оболочки, обеспечивающие удобный пользовательский интерфейс. Следует объяснять ученикам, что за этими оболочками, как правило, скрыт определенный формализованный язык. Например, за графической оболочкой операционной системы Windows скрывается командный язык ОС. Другой пример: СУБД MS Access предоставляет пользователю возможность для создания БД использовать конструктор таблиц, а для построения запросов — конструктор запросов. Однако за этими высокоуровневыми средствами “скрывается” SQL — универсальный язык описания данных и манипулирования данными. Перейдя в соответствующий режим, можно показать, как выглядят команды на SQL, сформированные в результате работы с конструктором. Язык и информация. Естественные и формальные языкиБилет № 3 Для обмена информацией с другими людьми человек использует естественные языки (русский, английский, китайский и др.). Основу языка составляет алфавит, или набор символов (знаков), которые человек различает по их начертанию. В основе русского языка лежит кириллица, содержащая 33 знака, в английском языке применяется латиница (26 знаков), в китайском языке — алфавит из десятков тысяч знаков (иероглифов). Последовательности символов алфавита образуют в соответствии с правилами грамматики основные объекты языка — слова. Правила, согласно которым строятся предложения из слов данного языка, называются синтаксисом. Необходимо отметить, что в естественных языках грамматика и синтаксис языка формулируются с помощью большого количества правил, из которых существуют исключения, поскольку такие правила складывались исторически. Наряду с естественными языками были разработаны формальные языки (нотная запись, языки программирования и др.). Основное отличие формальных языков от естественных состоит в наличии не только жестко зафиксированного алфавита, но и строгих правил грамматики и синтаксиса. Так, правила записи математических выражений можно рассматривать как формальный язык, имеющий алфавит (цифры) и позволяющий не только именовать и записывать объекты (числа), но и выполнять над ними арифметические операции по строго определенным правилам. В некоторых языках знаками являются не буквы и цифры, а другие символы — например, знаки химических элементов, музыкальные ноты, изображения элементов электрических или логических схем, дорожные знаки, точки и тире (код азбуки морзе) и др. Таким образом, представление информации посредством естественных и формальных языков производится с помощью алфавита — определенного набора знаков. Знаки могут иметь различную физическую природу. Например, для письма служат знаки, которые являются изображениями на бумаге, в устной речи в качестве знаков выступают различные звуки (фонемы), а при обработке текста на компьютере знаки представляются в форме последовательностей электрических импульсов. Алгоритмическое программирование. Основные способы организации действий в алгоритмах. Алгоритмическое программирование. Основные способы организации действий в алгоритмах. Язык программирования формируется на основе определенного алфавита и строгих правил построения предложений (синтаксиса). В алфавит языка могут входить буквы, цифры, математические символы, а также операторы, например Print (печать), Input (ввод) и др. С помощью алгоритмических языков программирования (их еще называют структурными языками программирования) любой алгоритм можно представить в виде последовательности основных алгоритмических структур: линейной, ветвления, цикла. Линейные алгоритмы. Линейные алгоритмы состоят из нескольких команд (операторов), которые должны быть выполнены последовательно одна за другой. Такие последовательности команд будем называть сериями. Чтобы сделать алгоритм более наглядным, часто используют блок-схемы. Различные элементы алгоритма изображаются с помощью различных геометрических фигур: начало и конец алгоритма обозначаются прямоугольниками с закругленными углами, а последовательности команд — прямоугольниками (рис. 3). Ветвление. В отличие от линейных алгоритмов, где команды выполняются последовательно одна за другой, в алгоритмические структуры ветвление входит условие, в зависимости от выполнения или невыполнения которого реализуется та или иная последовательность команд (серий) (рис. 4). Цикл. В алгоритмические структуры цикл входит серия команд, выполняемая многократно. Такая последовательность команд называется телом цикла. Циклические алгоритмические структуры бывают двух типов: — циклы со счетчиком, в которых тело цикла выполняется определенное количество раз (рис. 5); — циклы с условием, в которых тело цикла выполняется до тех пор, пока выполняется условие. Когда заранее известно, какое число повторений тела цикла необходимо выполнить, можно воспользоваться циклом со счетчиком. Однако часто бывает необходимо повторить тело цикла, но заранее неизвестно, какое количество раз это надо сделать. В таких случаях количество повторений зависит от выполнения некоторого условия. Условие выхода из цикла можно поставить в начале, перед телом цикла (рис. 6, а), или в конце, после тела цикла (рис. 6,b). Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет Язык как способ представления информацииАвтор работы: Пользователь скрыл имя, 22 Декабря 2011 в 06:00, контрольная работа ОписаниеСлово «информация» происходит от латинского слова informatio, что в переводе означает сведение, разъяснение, ознакомление. Понятие «информация» является базовым в курсе информатики, невозможно дать его определение через другие, более «простые» понятия. Работа состоит из 1 файлИнформатика контрольная.docВВЕДЕНИЕСлово «информация» происходит от латинского слова informatio, что в переводе означает сведение, разъяснение, ознакомление. Понятие «информация» является базовым в курсе информатики, невозможно дать его определение через другие, более «простые» понятия. В случае с понятием «информация» проблема его определения еще более сложная, так как оно является общенаучным понятием. Данное понятие используется в различных науках (информатике, кибернетике, биологии, физике и др.), при этом в каждой науке понятие «информация» связано с различными системами понятий. Для обмена информацией с другими людьми человек использует естественные языки (русский, английский, китайский и др.), то есть информация представляется с помощью естественных языков. В основе языка лежит алфавит, то есть набор символов (знаков), которые человек различает по их начертанию. В основе русского языка лежит кириллица, содержащая 33 знака, английский язык использует латиницу (26 знаков), китайский язык использует алфавит из десятков тысяч знаков (иероглифов). Последовательности символов алфавита в соответствии с правилами грамматики образуют основные объекты языка — слова. Правила, согласно которым образуются предложения из слов данного языка, называются синтаксисом. Необходимо отметить, что в естественных языках грамматика и синтаксис языка формулируются с помощью большого количества правил, из которых существуют исключения, так как такие правила складывались исторически. Наряду с естественными языками были разработаны формальные языки (системы счисления, язык алгебры, языки программирования и др.). Основное отличие формальных языков от естественных состоит в наличии строгих правил грамматики и синтаксиса. Например, системы счисления можно рассматривать как формальные языки, имеющие алфавит (цифры) и позволяющие не только именовать и записывать объекты (числа), но и выполнять над ними арифметические операции по строго определенным правилам. Некоторые языки используют в качестве знаков не буквы и цифры, а другие символы, например химические формулы, ноты, изображения элементов электрических или логических схем, дорожные знаки, точки и тире (код азбуки Морзе) и другие. Знаки могут иметь различную физическую природу. Например, для представления информации с использованием языка в письменной форме используются знаки, которые являются изображениями на бумаге или других носителях, в устной речи в качестве знаков языка используются различные звуки (фонемы), а при обработке текста на компьютере знаки представляются в форме последовательностей электрических импульсов (компьютерных кодов) ЯЗЫК КАК СПОСОБ ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ.ДВОИЧНАЯ ФОРМА ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ. Понятие информация является одним из фундаментальных в современной науке вообще и базовым для изучаемой ними информатики. Информацию рассматривают в качестве важнейшей сущности мира, в котором мы живем.Язык – это средство отражения и познания окружающего мира. Информационный процесс может осуществляться только при наличии языка. В зависимости от задач, которые мы перед собой ставим, можно использовать разные способы представления информации. Одно и та же информация может существовать в различных формах. Для представления информации удобно использовать знаковые системы. Знаковая система состоит из определенного набора знаков и из правил работы с ними.Знак – это сущность, имеющая некоторый смысл и некоторый внешний вид. Физический носитель знака может быть различным: для передачи одного и того же знака может использоваться в устной речи – звук, в письменной речи – буква, в памяти компьютера – последовательность электрических импульсов.Процесс перевода информации из одной формы представления в другую называют кодированием информации. С помощью двух цифр можно закодировать любое сообщение. Достоинство двоичного кодирования – простота реализации. Недостаток – длинные коды. Но в технике легче иметь дело с большим числом простых однотипных элементов, чем с большим числом сложных. Двоичная система используется в цифровой электронике, компьютерной технике. Двоичная система в современном представлении была полностью описана немецким философом и математиком Готтфридом Лейбницем в XVII веке в работе «Explication de l’Arithmetique Binaire» («Объяснение бинарной арифметики»). Компьютер обрабатывает информацию только в закодированном виде. Создатели компьютера отдают предпочтение именно двоичной системе счисления, потому что в техническом устройстве наиболее просто реализовать два противоположных физических состояния. В компьютере «бит» является наименьшей возможной единицей информации. Объем информации, записанной двоичными знаками в памяти компьютера или на внешнем носителе информации подсчитывается просто по количеству требуемых для такой записи двоичных символов. Для того чтобы при кодировании информация не потерялась и не исказилась, нужно устанавливать соответствие между двумя знаковыми системами. Составляют таблицы соответствия между знаками или группами знаков. Такие таблицы называются кодовыми. Язык является знаковой системой, соответственно в нем имеется набор знаков и список правил для работы с ними. Правила описывают способы составления из элементарных, основных знаков более сложных конструкций. Двоичная система счисления является основной системой представления информации в памяти компьютера. Язык некоторых компьютеров первого поколения основывался только с 50 – х годов 20 – го века, начала применяться практически во всех вычислительных машинах двоичная система, это было обусловлено: Объем информации, записанной двоичными знаками в памяти компьютера или на внешнем носителе информации подсчитывается просто по количеству требуемых для такой записи двоичных символов. Двоичное слово из восьми знаков содержит один байт информации, 1024 байта образуют килобайт, 1024 килобайта – мегабайт, а 1024 мегабайта – гигабайт. Двоичная система используется в цифровых вычислительных устройствах, поскольку является простой и удовлетворяет следующим требованиям: Система счисления в зависимости от способов изображения чисел делится на: Примером непозиционной системы счисления может служить римская система, в которой для каждого числа используется специфическое сочетание символов, например ХIV, CXXVII и тому подобное. Позиционная система счисления определяется ее основанием – числом используемых в ней чисел. В позиционных системах значение каждой цифры определяется ее местом в числе, любое число может быть представлено суммой произведения цифры. Среди позиционных систем счисления наибольшее распространение имеет двоичная система счисления с основанием 2. В ней используются только две цифры 0 и 1 (да – нет, ложь – истина, включено – выключено, есть сигнал – нет сигнала и тому подобное). Переход от десятичной записи к двоичной осуществляется легко: десятичное число делится на два, затем на два делится частное, затем – новое частное и так до тех пор, пока не будет получено последнее частное (равное 1), причем каждый раз записывается остаток от деления. Выписав последнее частное (1) и вслед за ним в обратном порядке все остатки от деления исходного числа на два, мы получим двоичный эквивалент исходного числа. Чтобы записать двоичное число в десятичной системе, необходимо обратить процедуру: умножить первую цифру слева на 2, к полученному результату прибавить вторую цифру слева, полученную сумму прибавить к третьей цифре слева и так далее до тех пор, пока мы не прибавим последнюю (самую правую) цифру двоичного числа. Десятичное число 6 в двоичной системе записывается как 0110 и расшифровывается так:
|