Суббота, 11 Сентября 2010 г. 02:05
ссылка
Спасибо, стараемся :-) Я не помню, дошёл ли в первой части Дима до упоминания рассказа Азимова "Профессия", но вот там как раз красочно описано, чем отличается образование, в котором знаешь, зачем оно нужно, и когда вообще ничего не понимаешь, но делаешь по инерции.
Класс!
Да я как-то из головы определения стараюсь не выдумывать, если что и говорю конкретными словами, то это цитаты из известных трудов, а остальное записывать под диктовку и смысла нет, лучше осознать и своё понимание записать. И веселье у нас идёт не на лекциях, а на лабах. Я даже высказывал предположение, что нам вообще лекции не сильно-то нужны. Материала, который можно единым блоком читать четыре часа, не так много (куда проще его разбивать), а лекция, которая проходит в большой аудитории с кучей народа, по расписанию, где все сидят, а ты стоишь -- тут как ни крутись, будет довольно формальная обстановка, а потому отдача меньше. Мы стараемся вести всё же диалог, но когда сидит одна группа, в нашем дисплейном классе, занятие идёт не по расписанию, а как договорились, многие со своими ноутами, становится гораздо проще, и народ больше вовлекается в процесс. А может, это я просто ещё не привык полноценно вести лекции. Всё таки, шесть лет опыта преподавания, по сравнению с двумя просто участия -- разница огромная, и я это вижу. Действительно свободно и непринуждённо вести у меня пока не получается. Учусь. Ну и на лабах у нас и происходит основное веселье, а не на лекциях. Лабы мы, увы, пока ещё дистанционно делать не научились, но могу привести примеры заданий после первой (была 4 и 6 сентября у двух групп): "06. Пользователь вводит три стороны одного треугольника и три -- другого.
Проверить, могу ли существовать такие треугольники (выполняется ли неравенство треугольника), и если могут -- проверить, являются ли они подобными", "09. Пользователь вводит четырёхразрядное число. Проверить, равна ли сумма кубов его цифр самому числу", "Пользователь вводит количество полутонов в интервале между двумя нотами. Найти отношение частот этих нот. Частоты соответствуют равномерно темперированному строю (f=440*2**(n/12), где f -- частота звука, а n -- номер полутона (может быть отрицательным))", ну и так далее. Что из этого выйдет, мы ещё не знаем, но планируем, что в качестве курсовой на первый семестр, они смогут писать простенькие игры.
О, слушай, это просто отлично! Это ведь не просто ты вопросы задаёшь, а я получаю ещё одну независимую рецензию. А знать информатику ты и не должна. И они тоже, по большей части, её в школе не учили. Так что, грубо говоря, мы и задумывали наш курс как то, что должен понять любой человек, а не только тот, кто и так уже в теме. Но то, что мы задумывали -- это ещё не факт, что у нас это получилось. Поэтому любое мнение тут важно.
Ааа, кстати да, неплохо бы это было отметить, точно. Честно говоря, всего Соссюра у меня не хватило терпения осилить, но, насколько я понимаю, это понятия о том, каким реальным вещам соответствуют слова в языке. В тех материалах по дискретной математике и математической лингвистике, которые я читал, об этом говорят, используя термины денотат (объект реального мира) и сигнификат (его представление). А в данном случае идёт речь не о теориях Соррюра, а о теории формальных грамматик Ноама Хомского. Символ в этой терминологии -- это то же самое, что "буква", "цифра", "значок" -- иными словами, элемент алфавита языка. Вот мы сказали, что выбираем набор абсолютно ничего не значащих различающихся элементов, и назовём их алфавитом языка, а каждый по отдельности -- символом. А потом, с помощью формальных грамматик, будем конструировать из них язык, причём, сам по себе он тоже может не иметь никакого смысла, пока мы явно (уже на следующем уровне) этот смысл ему не придадим.
Да, можно сравнивать. Есть штука под названием искусственные нейронные сети, и вот они, после долгого процесса обучения и самообучения, умеют определять похожесть двух объектов. По каким критериям, мы даже сами не всегда знаем, потому что они копируют и обобщают ответы человека, а не используют заранее взятые критерии. Но с поисковыми системами вообще (не только с картинками, с текстами тоже) есть одна проблема. Не знаю, сколько примерно информации в интернете вообще, но одни только картинки википедии весят около 5 терабайт. Сервера поисковика yahoo (а он куда как меньше гугла) имеют дисковый массив в 1000 с хвостиком терабайт (это называется петабайт). Сколько всего в интернете -- не знаю, но явно намного больше. По этой причине, совершенно нереально обходить весь интернет, каждый раз, когда пользователь делает поисковый запрос. Поисковики применяют штуку под названием индексация (кстати, одна из версий происхождения названия "Яндекс" -- Yet Another iNDEX). Независимо от пользовательских запросов, их программы, называемые поисковыми роботами (или ботами), обходят весь интернет и составляют индекс -- большой-большой набор адресов страниц и некоторых касающихся их данных (это и есть поисковая база данных). Вот эти данные могут быть много чем: ключевыми словами, основными темами, отрывками текста, популярностью страницы, количеством ссылок на её, не знаю -- количеством разных цветов, присутствующих на ней, и прочей ерундой, которая является тайной каждой компании. Главное, что индекс по размеру получается на много порядков меньше, чем интернет, но все стараются сделать так, чтобы та информация, которая в нём есть, была достаточно репрезентативной -- то есть, позволяла искать по индексу не сильно хуже, чем напрямую по интернету. А потом, когда пользователь вводит запрос, по своим хитрым алгоритмам, которые в общих чертах известны, а конкретные реализации, опять же, держатся в секрете, машина ищет уже по индексу то, что спросил пользователь. Так работает вообще любая поисковая система. Какие конкретно алгоритмы индексации использует тинай, я не знаю. Рискну предположить, что он может хранить очень сильно сжатую (до размера где-то 10x10 пикселей, или как-то так) картинку в индексе, и сравнивать с ней, может выделять цветовую гамму картинки, пробовать искать лица на картинке и их количество... В общем, выделять о картинке некую информацию, которая, в целом позволяет найти то, что устроит пользователя. Уверен только насчёт первого (сильно сжатой картинки) -- ребята из Яндекса говорили, что их алгоритмы поиска похожих картинок работают так. А остальное -- тут уж как придумали.
В смысле -- читаем вслух? Ну да, грубо говоря, понятия языка для нас дискретны, а звуки, которые произносятся -- аналоговые. Вот и происходить преобразование дискретной в аналоговую. А если читаем про себя с листа, то наоборот: картинка в глазах аналоговая, а мы её преобразуем в дискретные слова.
Ага, он. Он суров, это факт. Он ведь ещё в школе информатику ведёт (правда, не как у нас, а в школе с физмат уклоном, но возраст детей более высокий уровень предмета не меняет), так что имеет привычку обращаться с не слишком рационально мыслящим народом. Мы же с товарищем Столяровым придерживаемся мнения, что если они не хотят ничего делать, пусть ничего не делают молча, чтобы не мешать другим (а уже, как минимум, человек пять-шесть, которые слушают с интересом и задают интересные вопросы, я вижу). По этому поводу мы постоянно спорим. Ещё он придерживается мнения, что лучше читать курс строго, с последовательным изложением, а, отчаявшись за два года ввести такую систему в курсе программирования, мы решили, что будем работать по принципу "сначала делаем, потом думаем", пока практический навык не выработается, сильно грузить теорией не будем. Это тоже такой камень преткновения. Ну вот, где-то в среднем между такими подходами и получается то, что выходит. посмотрим.
А он пришёл не в конце. Сразу после конца первого видео он пришёл, представился, а потом просто сидел. Одну из пар он вёл сегодня, я тогда сейчас дам ссылку (заодно и поплачусь о своём :-D).