Язык программирования Си разработанный Деннисом Ритчи в начале 1970-х годов для создания операционной системы UNIX. Си остается наиболее широко используемым языком для написания системного программного обеспечения , и Cи также используется для написания приложений. Программирование для начинающих.
Особенности
Язык программирования C имеет следующие основные особенности:
- Фокусирование на парадигме процедурного программирования, с удобствами для программирования в структурированном стиле, это хороший плюс для изучения C.
- Доступ к аппаратному уровню через использование указателей для обозначения места в памяти .
- Параметры всегда передаются функции по значению, а не по ссылке.
- Область видимости лексических переменных (но не поддерживается замыкания или функции, определенные внутри других функций.)
- Стандартный набор библиотечных программ, которые предоставляют возможности, которые являются полезными, но не строго необходимы.
- Использование препроцессора языка, препроцессор C , для таких задач, как определение макросов и в том числе несколько файлов исходного кода.
- «О» производительность для всех операторов
Функциональность языка программирования C гарантируется ANS / ISO C99 C89/90 и нормативными документами, которые явно указывают, когда компилятор (или окружающая среда), выдает диагностику. Программирование для чайников. В документах также указано, какое поведение можно ожидать от кода, написанного на языке программирования Си, который соответствует стандарту.
Например, следующий код, в соответствии со стандартом, производит неопределенное поведение.
#include #include int main (void) { char *s = "Hello World!n"; strcpy (s, s+1); /* вероятно, что программист хотел удалить первый символ из строки S = S +1, */ return 0; }
Примечание: стиль отступов в программном коде меняется в зависимости от предпочтений программистов. См. стиль отступов для более подробной информации в разделе основы программирования.
«Неопределенное поведение» означает, что в результате программа может делать все, в том числе работать так, как задумал программист, или выдавая фатальные ошибки каждый раз при запуске, или вызывая одиночные сбои только каждый раз, когда происходит сорок второй запуск программы, или вызывает сбой, когда перезагружается компьютер, и т.д., до бесконечности.
Некоторые компиляторы не придерживаются ни одного из стандартов в режиме по умолчанию, что приводит к тому, что много программ пишется таких, которые будут компилироваться только с определенной версией компилятора и на определенную платформу (Windows, Linux или Mac).
Любая программа, написанная только на стандартном языке программирования C будет компилироваться без изменений на любой платформе, которая имеет соответствующие C реализации компилятора.
Хотя C обычно называется языком высокого уровня, это только язык «высокого уровня» по сравнению с ассемблером , но значительно ниже уровнем, чем большинство других языков программирования. Но в отличии от большинства он дает программисту возможность полностью управлять содержимым памяти компьютера . С не дает инструментов для проверки границ массива или автоматической сборки мусора .
Руководство управления памятью обеспечивает программисту большую свободу в настройке производительности программы, что особенно важно для таких программ, как драйверы устройств. Однако, она также легко позволяет случайно создать код с ошибками, вытекающих из ошибочных операций с памятью, таких как переполнение буфера. Некоторые инструменты были созданы, чтобы помочь программистам избежать этих ошибок, в том числе библиотеки для проведения проверки границ массива и сбор мусора, и библиотеки проверки исходного кода. Преднамеренное использование программ, написанных на С с нуля и содержащих механизм переполнения буфера очень распространено во многих компьютерных вирусов и очень популярно у хакеров, разрабатывающих компьютерные черви.
Некоторые из выявленных недостатков С были рассмотрены и учтены в новых языках программирования, полученных из Си. Язык программирования Циклон имеет особенности, для защиты от ошибочных операций с памятью. C++ и Objective C обеспечивает конструкции предназначены для облегчения объектно-ориентированного программирования . Java и C # добавили конструкции объектно-ориентированное программирование, а также более высокий уровень абстракции, например, автоматическое управление памятью.
История
Начальное развитие C произошло между 1969 и 1973 (в соответствии с Ритчи, самый бурный период в 1972 году). Он назывался «С», потому что многие функции, были получены из предшественника языка по имени B , который сам в свою очередь был назван Бон в честь жены Бонни Кен Томпсон.
К 1973 году язык программирования Си стал достаточно мощным, поэтому большая часть ядра из операционной системы Unix была переписана на C, для сравнения операционная система Multics реализована на языке A, ОС Tripos(реализована на языке BCPL. В 1978 году Ричи и Брайан Керниган опубликовали «язык программирования C» (так называемыую «белую книгу», или K & R.) на протяжении многих лет, эта книга служила спецификацией языка, и даже сегодня, это издание пользуется большой популярностью как руководство и учебник.
С стал очень популярным за пределами Bell Labs с 1980-х годов , и было какое-то время доминирующим языком в системах и приложениях программирования микрокомпьютеров. До сих пор наиболее часто используемых языков программирования системы, и является одним из наиболее часто используемых языков программирования в компьютерах для естественно-научного образования.
В конце 1980-х годов , Бьерн Страуструп и другие в Bell Labs работали, чтобы добавить объектно-ориентированные конструкции для C. Язык, который они разработали вместе с первым компилятором Cfront, назвали C++ (что позволяет избежать вопроса о том, что преемник «B» и «С» должен быть «D» или «Р»). В настоящее время язык C++ чаще всего используется для коммерческих приложений для операционной системы Microsoft Windows, хотя C остается очень популярным в мире Unix.
Версии C
K & R Си (Керниган и Ритчи Си)
С развивался непрерывно с момента его зарождения в Bell Labs. В 1978 был опубликовано первое издание Кернигана и Ритчи «Язык программирования C». Он ввел следующие особенности для существующих версий C:
- structure тип данных
- long int тип данных
- unsigned int тип данных
- =+ оператора было изменено на += , и так далее ( так как оператор =+ постоянно вызывал ошибки лексического анализатора в C).
В течение нескольких лет, первое издание «Язык программирования C» был широко использован в качестве спецификации языка де-факто. Версию Си описанную в этой книге, как правило, называют «K & R C» (Второе издание охватывает ANSI стандарт C, описанных ниже.)
K & R C часто считается основной частью языка, которая необходима для компилятора C. Так как не все компиляторы, используемые в настоящее, время были обновлены для полной поддержки ANSI C полностью, и достаточно хорошо написанный K & R C код также правилен с точки зрения стандарта ANSI C. Поэтому K & R C считается наименьшим общим знаменателем, которого программисты должны придерживаться для достижения максимальной переносимости. Например, начальная загрузка версии компилятора GCC, xgcc, написано в K & R С. Это происходит потому, что на многих из платформ, поддерживаемых GCC не было правильного ANSI C компилятора GCC, поэтому была написана, только одна базовая реализация K & R языка С.
Однако, ANSI C сейчас поддерживают почти все широко используемые компиляторы. Большая часть кода C с ноля пишется в настоящее время только для использования возможностей языка, которые выходят за рамки первоначальной K & R спецификации.
ANSI C и ISO C
В 1989 , C был впервые официально стандартизирован ANSI в ANSI X3.159-1989 «Язык программирования С». Одна из целей ANSI C было создание расширенного K & R С. Однако, комитетом по стандартам были также включены несколько новых возможностей, которые внесли много новшеств, чем обычно это происходило в программировании при стандартизации языка.
Некоторые из новых возможностей были «неофициально» добавлены в язык после публикации K & R, но до начала процесса ANSI C. К ним относятся:
-
- void функции
- функции, возвращающие struct или union типы данных
- void * тип данных
- const квалификатор, чтобы сделать объект доступным только для чтения
- struct имена полей в отдельное пространство имен для каждого типа структуры
- выделение памяти на struct типов данных
stdio библиотеки и некоторые другие стандартные функции библиотеки стали доступны в большинстве реализаций (это уже существовало, ну по крайней мере одна реализация в момент создания K & R Си, но на самом деле это был не стандарт, и, следовательно, не было документирована в книге)
- stddef.h заголовочный файл и ряд других стандартных заголовочных файлов.
Некоторые функции были добавлены в C в процессе стандартизации комиссией ANSI, в первую очередь прототипы функций (заимствованные из С++ ). Си по стандарту ANSI также установил стандартный набор библиотечных функций .
Язык программирования С по стандарту ANSI, с небольшими изменениями был принят в качестве стандарта ИСО за номерорм ISO 9899 . Первое издание ISO этого документа был опубликовано в 1990 (ISO 9899:1990).
C 99
После процесса стандартизации ANSI, спецификации языка C остается относительно неизменным в течение некоторого времени, тогда как C++ продолжает развиваться. (На самом деле, Нормативной Поправкой 1 создана новая версия языка C в 1995 году, но эта версия редко признается.) Однако, стандарты подверглись пересмотру в конце 1990-х годов , что привело к созданию ISO 9899:1999, который был опубликован в 1999 году. Этот стандарт обычно называют «C99». Он была принята в качестве стандарта ANSI в марте 2000.
Новые функции, добавленные в C99 включают в себя:
- встроенные функции
- освобождение ограничения на расположение объявления переменных (в соответствии с C++)
- Помимо нескольких новых типов данных, включая long long int (для уменьшения проблем связанных с переходом с 32-разрядных на 64-битные процессоры, надвигающегося на много старых программ, которое предсказало устаревания x86 архитектуры), явный булев типа данных, и тип представляющая комплексные числа
- массивы переменной длины
- Официальная поддержка комментариев, начинающиеся с «/ /» как в C++ (которые уже поддержали многие компиляторы C89 как расширение не-ANSI)
- несколько новых библиотечных функций, в том числе snprintf
- несколько новых заголовочных файлов, в том числе stdint.h
Интерес к поддержке новых особенностей С99 является смешанной. Хотя GCC и нескольких коммерческих компиляторы поддерживают большинство из новых особенностей С99, компиляторы сделанные Microsoft и Borland не поддерживают, и эти две компании, похоже, не заинтересованы в добавлении такой поддержки.
Программа «Hello, World!» на языке Си
Следующее простое приложение выводит » Hello, World «в стандартный файл вывода (обычно экран, но может быть файл или какой-либо другое аппаратное устройство). Изменение этой программы появилась впервые в K & R.
#include <stdio.h> int main(void) { printf("Hello, World!n"); //комментарий return 0; /* комментарий на несколько строк */ }
Обычно текст, который не является программой, а служит подсказкой для программиста записывается в виде комментария. // однострочнй или /* многострочный*/
Анатомия программы на языке C
Си программа состоит из функций и переменных. Си функции как подпрограммы и функции Fortran или процедуры и функции Паскаля . Особенность функции main в том, что программа начинает выполнение именно с функции main . Это означает, что каждая программа Си должна иметь main функцию.
main функция, как правило, вызывает другие функции, которые помогают выполнять свою работу, например, printf в приведенном выше примере. Программист может написать некоторые из этих функций, а другие могут быть вызваны из библиотеки. В приведенном выше примере return 0 дает возвращаемое значения для main функций. Это указывает на успешное выполнение программы для вызова оболочки программы.
Си функция состоит из типа возвращаемого значения, имени, списка параметров (или void в скобках, если таковых нет) и тела функции. Синтаксис функции тела эквивалентен составному оператору.
Управляющие структуры
Составные операторы
Составные операторы в C имеют вид
{ }
и используются в качестве тела функции и в тех местах, где ожидается несколько действий в одном блоке.
Оператор объявления
Утверждение вида
;
является выражением объявления. Если выражение отсутствует , то такое утверждение называется пустым оператором.
Оператор выбора
C имеет три типа оператора выбора: два вида if и switch оператор.
Два вида if,
if ()
{
}
или
if ()
{
}
else
{
}
В if объявлении, если выражение в скобках отлично от нуля или правда, то управление передается оператору, следующему за if . Если в предложении присутствует else, то контроль перейдет к следующему за else набору действий, если выражение в скобках равно нулю или ложно.
Оператор управления switch – в этом случае необходимо перечислить несколько значений, которые может принимать переменная, стоящая в качестве переменной выбора, которое должно иметь целый тип. Для каждого значения переменной-выбора могут выполнятся несколько действий, которые выбираются. Каждая ветка действий может быть помечена с помощью case метки, что выглядит как ключевое слово case, которое следует константным выражением, а затем двоеточие (:). Никакие значения, связанных с константами switch не могут иметь одно и тоже значение. Также может быть не более одной default метки, связанной со swith; управление передается default метке, если ни одно из константных значений не совпало с переменной выбора, которая стоит в скобках после switch . В приведенном ниже примере, если будет совпадение переменной выбора и константы, то тогда будет выполнен набор действий идущий после двоеточия
switch () { case : printf(); break; case : printf(); break; default : }
Повторения (Циклы)
Си имеет три формы операторов циклов:
do { } while (); while () { } for ( ; ; ) { }
В while и do операторах, тело выполняется неоднократно, пока значение выражения остается ненулевой или правдой. Для while проверка равильности условия происходит каждый раз перед началом выполнения; для do проверка условия происходит после выполнеия тела цикла.
Если все три выражения присутствуют в операторе for
for (e1; e2; e3) s;
то это эквивалентно тому же, что и
e1; while (e2) { s; e3; }
Любое из трех выражений в операторе цикла for могут быть опущены. Отсутствие второго выражение делает while проверку условия всегда ненулевой, создавая бесконечный цикл.
Операторы перехода
Оператор безусловного перехода. Существуют четыре типа операторов перехода в C: goto , continue , break , и return .
goto заявление выглядит следующим образом:
goto <метка>;
Идентификатор должен указывать на метку, расположенную в текущей функции. Управление передается на помеченный оператор.
continue оператор может появиться только в пределах повторения цикла и заставляет пропустить оставшиеся шаги на текущем месте и перейти к следующему шагу цикла. То есть, в каждом из заявления
while (expression) { /* ... */ continue; } do { /* ... */ continue ; } while (expression); for (optional-expr; optexp2; optexp3) { /* ... */ continue ; }
break оператор используется для выхода из циклов for , while, do, или switch. Управление передается оператору, следующему за тем, в котором было прервано действие.
Функция возвращает в то место, из которого было вызвано значение с помощью оператора return . После return следует выражение, значение которого возвращается в место, откуда вызывалась. Если функция не содержит оператор return, то это эквивалентно return без выражения. В любом случае, возвращаемое значение не определено.
Порядок применения операторов в C89
- () [] ->. + + — (CAST) Postfix операторов
- + + — * & ~! + — SizeOf унарные операторы
- * /% Мультипликативных операторов
- + — Аддитивные операторы
- << >> Операторов сдвига
- < <= > >= Реляционных операторов
- =! == Операторов равенства
- & Побитовое и
- ^ Побитовое исключающее ИЛИ
- | Побитовое включительно, либо
- & & Логическое и
- | | Логических или
- ?: Условный оператор
- = += -= *= /= %= <<= >>=
- & = | = ^ Операторов присваивания =
- , Оператор запятая
Объявление данных
Элементарные типы данных
Значения в <limits.h> и <float.h> заголовочных файлах определяют диапазоны основных типов данных. Диапазоны float , double , и long double типа, как правило, упомянуты в IEEE 754 стандарте.
имя | минимальный дипазон |
---|---|
char |
-127..127 или 0..255 |
unsigned char |
0..255 |
signed char |
-127..127 |
int |
-32767..32767 |
short int |
-32767..32767 |
long int |
-2147483647..2147483647 |
float |
1e-37..1e+37 (положительные числа) |
double |
1e-37..1e+37 (положительные числа) |
long double |
1e-37..1e+37 (положительные числа) |
Массивы
Если объявление переменной происходит с использованием вместе с указанием квадратных скобок ( [] ), то считается, что объявлен массив. Строки это массивы символов. Они заканчиваются символом нуля (представлен в С как ‘ ‘ , нулевой символ ).
Примеры:
int myvector [100];
char mystring [80];
float mymatrix [3] [2] = {2.0 , 10.0, 20.0, 123.0, 1.0, 1.0}
char lexicon [10000] [300] ; /* 10000 строк, каждая из которых может сожержать максимум 300 символов. */
int a[3][4];
Последний пример создает массив массивов, но может рассматриваться как многомерный массив для решения большинства задач. Для доступа к 12 int значеням массива «a», можно использовать следующий вызов:
a[0][0] |
a[0][1] |
a[0][2] |
a[0][3] |
a[1][0] |
a[1][1] |
a[1][2] |
a[1][3] |
a[2][0] |
a[2][1] |
a[2][2] |
a[2][3] |
Указатели
Если переменная предваряется символом звездочка (*) в своем заявлении , тогда она становится указателем.
Примеры:
int *pi; /* указатель на целое */
int *api[3]; /* массив указателей целого типа */
char **argv; указатель на куазатель на char */
Значение в адресе хранится в переменной-указателе и могут быть доступны в программе при вызове переменной-указателя со звездочкой. Например, если первое заявление приведенном выше примере, *pi является int . Это называется «разыменования» указателя.
Другой оператор, & (амперсанд), называется адрес-оператора, возвращает адрес переменной, массива или функции. Таким образом, с учетом вышесказанного
int i, *pi; /* объявим целое и указатель на целое */
pi = &i;
i и *pi могут быть использованы как взаимозаменяемые (по крайней мере до того, как pi будет установлено что-то другое).
Строки
Для работы со строками вам не нужно включать библиотеку, потому, что в стандартной библиотеке C, уже присутствуют функции для обработки строк и блоков данных, как если бы они были массивы типа char .
Наиболее важные функции строки:
- strcat(dest, source) — добавляет строку source в конец строки dest
- strchr(s, c) — находит первую очередь характера c в строку s и возвращает указатель на него или пустой указатель, если c не найден
- strcmp(a, b) — сравнивает строки и a b (лексических заказа); возвращает отрицательным, если меньше a b , 0, если равны, положительным, если больше.
- strcpy(dest, source) — копирует строку source в строку dest
- strlen(st) — возвращает длину строки st
- strncat(dest, source, n) — добавляет максимум n символов из строки source в конец строки dest ; символы после нулевого символа не копируются.
- strncmp(a, b, n) — сравнивает максимум n символов из строки и a b (лексических заказа); возвращает отрицательным, если меньше a b , 0, если равны, положительным, если больше.
- strncpy(dest, source, n) — копии максимум n символов из строки source в строку dest
- strrchr(s, c) — находит последний экземпляр символа c в строку s и возвращает указатель на него или пустой указатель, если c не найден
Менее важные функции строки:
- strcoll(s1, s2) — сравнить две строки в соответствии с локали упорядоченной последовательности
- strcspn(s1, s2) — возвращает индекс первого символа в s1 , что соответствует любому символу, в s2
- strerror(err) — возвращает строку с сообщением об ошибке соответствующий код в err
- strpbrk(s1, s2) — возвращает указатель на первый символ в s1 , что соответствует любому символу, в s2 или пустой указатель, если не найден
- strspn(s1, s2) — возвращает индекс первого символа в s1 , который соответствует не символ в s2
- strstr(st, subst) — возвращает указатель на первое вхождение строки subst в st или пустой указатель, если нет такой подстроки существует.
- strtok(s1, s2) — возвращает указатель на маркер в s1 разделяются символами в s2 .
- strxfrm(s1, s2, n) — преобразует s2 в s1 использовании локали правил
Файл ввода / вывода В языке программирования Си, ввод и вывод осуществляется через группу функций в стандартной библиотеке. В ANSI / ISO Си, те функции, которые определены в<stdio.h> заголовка.
Три стандартных потока ввода-вывода
stdin стандартный ввод
stdout стандартный вывод
stderr стандартная ошибка
Эти потоки автоматически открывается и закрывается средой исполнения, они не должны быть открыты в явном виде.
В следующем примере показано, как структурирована обычная программа для фильтрации букв :
//Заголовочные файлы, например, #include <stdio.h&qt; int main() { int c; while (( c = getchar()) != EOF ) { /* do various things to the characters */ if (anErrorOccurs) { fputs("an error eee occurredn", stderr); break; } /* ... */ putchar(c); /* ... */ } return 0; }
Передача аргументов командной строке
Параметрами, представленными в командной строки передаются в программу C с двумя предопределенными переменными – кол-во аргументов командной строки хранится в переменной argc, а отдельные аргументы как символьные массивы в указателе на массив argv . Так запуск программы их командной строки в в виде
Myprog p1 p2 p3
даст результаты похожие на (примечание: нет никакой гарантии, что отдельные строки являются смежными):
К отдельным значениям параметров можно получить доступ используя argv[1] , argv[2] , или argv[3] .
Си библиотеки
Многие особенности языка Си обеспечиваются стандартной библиотекой Си. «Хостинг» реализация предоставляет все библиотеки C. (В большинстве реализаций размещаются, но некоторые, не предназначены для использования с операционной системой). Доступ к библиотеке достигается в том числе стандартными заголовками через директиву препроцессора #include. См. ANSI C стандартные библиотеки , GCC ( GNU C Compiler).