Зависание процессов classic на linux

Access Violation, некорректное выполнение запросов или вызовов API, ошибки утилит командной строки, в общем все, что вам мешает работать

Модераторы: kdv, dimitr

aaa3d
Сообщения: 69
Зарегистрирован: 23 ноя 2005, 11:06

Сообщение aaa3d » 07 авг 2006, 09:27

в принципе так и хотели, аднинская часть там удобная.
из ваших слов понимаю что на мандриве Firebird ведет себя корректно.

Merlin
Динозавр IB/FB
Сообщения: 1502
Зарегистрирован: 27 окт 2004, 11:44

Сообщение Merlin » 07 авг 2006, 12:58

aaa3d писал(а): что ставить на серваки? будет крутиться Firebird 1.5.3
Открыть релизные ноты и прочитать что рекомендовано.
aaa3d писал(а): Fedor'у зарубили. кого еще зарубите что знать :) а то напороться
потом не хотелось бы на глюки
Никто никого не рубил. Релизные билды собираются на определённой платформе. Остальное - свободное творчество масс, сорцы есть, не идёт, но нужно - пособирать своим компайлером со своими либами, потыркаться, поразбираться. На все оси порт-мантайнеров нет. Это опен сорц, кому-то что-то нужно - он делает и делится с другими.

kdv
Forum Admin
Сообщения: 6595
Зарегистрирован: 25 окт 2004, 18:07

Сообщение kdv » 08 авг 2006, 18:23

что ставить на серваки? будет крутиться Firebird 1.5.3
в стиле вредных советов - надо найти экзотический дистрибут варианта линукса, наименее распространенный. всякие мандривы, федоры и прочие горы. Поставить, и трахаться, трахаться, трахаться до посинения.

Dimitry Sibiryakov
Заслуженный разработчик
Сообщения: 1436
Зарегистрирован: 15 сен 2005, 09:05

Сообщение Dimitry Sibiryakov » 09 авг 2006, 08:01

С каких это пор мандрива стала экзотической? За ее плечами опыт мандрейка (на котором FB крутилась без особых усилий).

kdv
Forum Admin
Сообщения: 6595
Зарегистрирован: 25 окт 2004, 18:07

Сообщение kdv » 09 авг 2006, 11:59

хорошо, я отстал, не знал что Mandriva - наследник Mandrake. Но, думаю, в данном случае, и вообще глядя на линуксы, "опыт за плечами" ничего не значит.

Merlin
Динозавр IB/FB
Сообщения: 1502
Зарегистрирован: 27 окт 2004, 11:44

Сообщение Merlin » 09 авг 2006, 12:04

Федора тоже наследник RH :) На самом деле здесь скорее вопрос совместимости конкретных оси и билда, если отбросить тупые попытки водрузить билд 2006 года на ось 2003 или наоборот. У меня вот то, что Сергей собирает на Федоре в снапшоты, вообще не ставится, а Сашины консервативные релизные билды на ура.

victor3000
Сообщения: 98
Зарегистрирован: 27 апр 2006, 09:32

Сообщение victor3000 » 27 авг 2006, 20:58

итак проверено еще на red hat 9, suse 10. результат тот же: super server работает стабильно, classic blockiiiiiiiiiing. вопрос в следующем: под класик надо по другому кодить прогу? :) да кстати какой еще дистрибутив проверить?
проверено:
fedora core 3
fedora core 5
alt linux
red hat 9
suse 10.
сборки firebird
1.5.3
2 rc1,rc2,rc3,rc4.

hvlad
Разработчик Firebird
Сообщения: 1244
Зарегистрирован: 21 мар 2005, 10:48

Сообщение hvlad » 28 авг 2006, 11:23

Если всё так хреново и оно тебе действительно нужно - готовь тест кейс и регистрируй здесь

victor3000
Сообщения: 98
Зарегистрирован: 27 апр 2006, 09:32

Сообщение victor3000 » 30 авг 2006, 06:29

все не так уж и хреново, проблему решил :), всем спасибо за терпение и подержку. уже работает 48 часов полет нормальный(макс был в районе 10 часов). если еще пару дней продержится отпишу в чем была проблема.

hvlad
Разработчик Firebird
Сообщения: 1244
Зарегистрирован: 21 мар 2005, 10:48

Сообщение hvlad » 07 сен 2006, 16:53

victor3000 писал(а):все не так уж и хреново, проблему решил :), всем спасибо за терпение и подержку. уже работает 48 часов полет нормальный(макс был в районе 10 часов). если еще пару дней продержится отпишу в чем была проблема.
Ну и ?

WildSery
Заслуженный разработчик
Сообщения: 1738
Зарегистрирован: 05 июн 2006, 16:19

Сообщение WildSery » 07 сен 2006, 16:55

hvlad писал(а):Ну и ?
Видимо, не продержался и всё рухнуло. Занят раскопками обломков.

adima
Сообщения: 12
Зарегистрирован: 06 сен 2005, 16:16

Сообщение adima » 27 окт 2006, 13:13

hvlad писал(а):
adima писал(а):у нас тоже такая проблема . Классик 1.5.2 под Suse Linux 9.0. Периодически, достаточно редко сервер внезапно останавливается, загрузка нулевая, пользователи жалуются на то, что все "висит". Помогает только "отстрел" всех коннектов. Причины не очень понятны
Зуб дашь, что такая ?
sweep_interval чему равен ?
gstat -h в момент зависания делал ?
Извините, что поднимаю старую ветку. Но все же хочется узнать причину. Напомню, что используем Firebird 1.5.2 CS Suse Linux 9
В последнее время зависания посреди рабочего дня сервер встает.
Видно, что отдельные коннекты что то делают, но очень редко. Приложение при подключении к базе висит, но точно процесс Firebird запускается (в базе есть протоколирование вызовов процедур). Я собрал статистику с header page и вывод fb_lock_print в момент зависания.

adima
Сообщения: 12
Зарегистрирован: 06 сен 2005, 16:16

Сообщение adima » 27 окт 2006, 13:15

после такого отстрела коннектов в базе появляются испорченные индексы и осиротевшие страницы.

в какую сторону нужно копать?

kdv
Forum Admin
Сообщения: 6595
Зарегистрирован: 25 окт 2004, 18:07

Сообщение kdv » 27 окт 2006, 13:28

присылай файлы (запакованные) на support@ibase.ru
нечего сюда такие портянки слать.

Напомню, что используем Firebird 1.5.2
заодно напомню, что есть FB 1.5.3.

adima
Сообщения: 12
Зарегистрирован: 06 сен 2005, 16:16

Сообщение adima » 27 окт 2006, 13:34

kdv писал(а):присылай файлы (запакованные) на support@ibase.ru
нечего сюда такие портянки слать.

Напомню, что используем Firebird 1.5.2
заодно напомню, что есть FB 1.5.3.
отправил

hvlad
Разработчик Firebird
Сообщения: 1244
Зарегистрирован: 21 мар 2005, 10:48

Сообщение hvlad » 27 окт 2006, 14:40

Page size 16384
ODS version 10.1
Oldest transaction 5332340
Oldest active 5750321
Oldest snapshot 5749025
Next transaction 5758395

Creation date Oct 22, 2006 3:02:45
Attributes force write, no reserve
1. OIT 'застяла', посему размер активной части TIP ~104KB. Т.е. каждая снапшот тр-ция жрёт при старте сразу 104КB
2. Какого стоит no reserve ?
3. За 5 дней почти 6М тр-ций - что вы там делаете ?
4. По лок-таблице могу пока только сказать что у вас 202 процесса. Вы уверены, что ОС выдерживает такую нагрузку ?

adima
Сообщения: 12
Зарегистрирован: 06 сен 2005, 16:16

Сообщение adima » 27 окт 2006, 15:08

hvlad писал(а):
Page size 16384
ODS version 10.1
Oldest transaction 5332340
Oldest active 5750321
Oldest snapshot 5749025
Next transaction 5758395

Creation date Oct 22, 2006 3:02:45
Attributes force write, no reserve
1. OIT 'застяла', посему размер активной части TIP ~104KB. Т.е. каждая снапшот тр-ция жрёт при старте сразу 104КB
2. Какого стоит no reserve ?
3. За 5 дней почти 6М тр-ций - что вы там делаете ?
4. По лок-таблице могу пока только сказать что у вас 202 процесса. Вы уверены, что ОС выдерживает такую нагрузку ?
1. Застревание транзакций видимо происходит из-за работы удаленных пользователей, разрывы связи достаточно частое явление.
2. Честно - не знаю. Параметр -use_all_space при ресторе стоит в скрипте бекапа/рестора. Скрипт писался наверное много лет назад. Когда я спрашивал предыщего администратора, зачем это было сделано, ответ был примерно такой: так как пользователи в основном работают с данными, давность которых максимум месяц-два, то чтобы сократить место занимаемое БД флаг и включили. Насколько это оправданно, сказать не могу.
3. В системе принят такой подход - старт транзакции, выполнение ХП, коммит транзакции (для мест где не требуется другая логика). Таких вызовов большинство. Отсюда большое количество транзакций.
4. Большею частью это спящие процессы. Активных из них не более двадцати (одновременно). Программы соединяются с сервером и держат коннект. Нужны им данные - полезли в базу, не нужны просто держат коннект.

hvlad
Разработчик Firebird
Сообщения: 1244
Зарегистрирован: 21 мар 2005, 10:48

Сообщение hvlad » 27 окт 2006, 16:22

adima писал(а):1. Застревание транзакций видимо происходит из-за работы удаленных пользователей, разрывы связи достаточно частое явление.
OIT застревает только если в тр-ции было много _изменений_, т.е. роллбэк делался через TIP, а не через undo-log.
Свип нужно делать.
adima писал(а):2. Честно - не знаю. Параметр -use_all_space при ресторе стоит в скрипте бекапа/рестора. Скрипт писался наверное много лет назад. Когда я спрашивал предыщего администратора, зачем это было сделано, ответ был примерно такой: так как пользователи в основном работают с данными, давность которых максимум месяц-два, то чтобы сократить место занимаемое БД флаг и включили. Насколько это оправданно, сказать не могу.
Бредятина имхо
adima писал(а):4. Большею частью это спящие процессы. Активных из них не более двадцати (одновременно). Программы соединяются с сервером и держат коннект. Нужны им данные - полезли в базу, не нужны просто держат коннект.
Сколько памяти на сервере, сколько задано кеша и сколько весит каждый процесс (примерно) ?

adima
Сообщения: 12
Зарегистрирован: 06 сен 2005, 16:16

Сообщение adima » 27 окт 2006, 16:55

hvlad писал(а):Свип нужно делать.
Свип делается каждую ночь.
hvlad писал(а):Бредятина имхо
Возможно. Как может влиять этот параметр на производительность
активной используемой базы?
hvlad писал(а):Сколько памяти на сервере, сколько задано кеша и сколько весит каждый процесс (примерно) ?
памяти 12 Гб, кеш по дефолту 75 страниц, каждый процесс в среднем весит 20 Мб (есть десяток толстых - 30 - 60)

hvlad
Разработчик Firebird
Сообщения: 1244
Зарегистрирован: 21 мар 2005, 10:48

Сообщение hvlad » 27 окт 2006, 17:54

adima писал(а):
hvlad писал(а):Свип нужно делать.
Свип делается каждую ночь.
Молоцца ;)
adima писал(а):
hvlad писал(а):Бредятина имхо
Возможно. Как может влиять этот параметр на производительность
активной используемой базы?
Отрицательно. Версии записей будут располагаться на других страницах, хотя могли бы быть на той же, где 'основная' версия. Соответственно disk IO больше, чем мог бы быть
adima писал(а):
hvlad писал(а):Сколько памяти на сервере, сколько задано кеша и сколько весит каждый процесс (примерно) ?
памяти 12 Гб, кеш по дефолту 75 страниц, каждый процесс в среднем весит 20 Мб (есть десяток толстых - 30 - 60)
Значит по ресурсам вписываетесь. Хорошо

Вернёмся тогда к
adima писал(а):3. В системе принят такой подход - старт транзакции, выполнение ХП, коммит транзакции (для мест где не требуется другая логика).
Какие пар-ры этих тр-ций ?

Ещё было бы неплохо прислать (туда же) полную статистику (gstat -r).
До свипа, естественно ;)

Ответить