Коап ч 2 ст 5 27 коап рф: КоАП РФ Статья 5.27. Нарушение трудового законодательства и иных нормативных правовых актов, содержащих нормы трудового права

Содержание

Ответственность работодателя за нарушения: за что, как и когда

Выбрать журналАктуальные вопросы бухгалтерского учета и налогообложенияАктуальные вопросы бухгалтерского учета и налогообложения: учет в сельском хозяйствеБухгалтер Крыма: учет в унитарных предприятияхБухгалтер Крыма: учет в сельском хозяйствеБухгалтер КрымаАптека: бухгалтерский учет и налогообложениеЖилищно-коммунальное хозяйство: бухгалтерский учет и налогообложениеНалог на прибыльНДС: проблемы и решенияОплата труда: бухгалтерский учет и налогообложениеСтроительство: акты и комментарии для бухгалтераСтроительство: бухгалтерский учет и налогообложениеТуристические и гостиничные услуги: бухгалтерский учет и налогообложениеУпрощенная система налогообложения: бухгалтерский учет и налогообложениеУслуги связи: бухгалтерский учет и налогообложениеОплата труда в государственном (муниципальном) учреждении: бухгалтерский учет и налогообложениеАвтономные учреждения: акты и комментарии для бухгалтераАвтономные учреждения: бухгалтерский учет и налогообложениеБюджетные организации: акты и комментарии для бухгалтераБюджетные организации: бухгалтерский учет и налогообложениеКазенные учреждения: акты и комментарии для бухгалтераКазенные учреждения: бухгалтерский учет и налогообложениеОплата труда в государственном (муниципальном) учреждении: акты и комментарии для бухгалтераОтдел кадров государственного (муниципального) учрежденияРазъяснения органов исполнительной власти по ведению финансово-хозяйственной деятельности в бюджетной сфереРевизии и проверки финансово-хозяйственной деятельности государственных (муниципальных) учрежденийРуководитель автономного учрежденияРуководитель бюджетной организацииСиловые министерства и ведомства: бухгалтерский учет и налогообложениеУчреждения здравоохранения: бухгалтерский учет и налогообложениеУчреждения культуры и искусства: бухгалтерский учет и налогообложениеУчреждения образования: бухгалтерский учет и налогообложениеУчреждения физической культуры и спорта: бухгалтерский учет и налогообложение

20192020

НомерЛюбой

Электронная версия

Можно написать ходатайство о смягчении административного штрафа?, Улан-Удэ | вопрос №13114314 от 20.08.2021

По электронной почте — не значит, что Вас уведомили надлежащим образом. Тем более если речь идет о протоколе — должны вручить Вам под роспись оригинал. Это на всякий случай Вам. Если мало времени на подготовку.

Что касается пункта «ходатайства и отводы не поступали» — это касается опять-таки протокола, при его составлении. Если во время протокола Вы заявляете какое-нибудь ходатайство — об этом пишется в протоколе. Если не пишут — сами делаете замечания.

Вам не поздно еще заявить ходатайство о применении к Вам малозначительности или учета смягчающих обстоятельств. Если сумма материального ущерба невелика, то можете указать о малозначительности.

Опять же в ст.5.27 КоАП РФ есть предупреждение для должностного лица. Если будут привлекать должностное лицо, то должны сначала вынести предупреждение. Если все-таки будут кроме того привлекать юридическое лицо, а там минимальный штраф немаленький, то нужно сделать все от Вас зависящее, чтобы потом возможно в суде обжаловать штраф.

Приводите обстоятельства, смягчающие ответственность.

Более детально надо изучить дело, документы, лучше всего с юристом.

КоАП РФ, Статья 2.9. Возможность освобождения от административной ответственности при малозначительности административного правонарушения

«»При «малозначительности» совершенного административного правонарушения судья, орган, должностное лицо, уполномоченные решить дело об административном правонарушении, могут освободить лицо, совершившее административное правонарушение, от административной ответственности и ограничиться устным замечанием.

Статья 4.2. Обстоятельства, смягчающие административную ответственность

«»1. Обстоятельствами, смягчающими административную ответственность, признаются:

1) раскаяние лица, совершившего административное правонарушение;

«»2) добровольное прекращение противоправного поведения лицом, совершившим административное правонарушение;

3) добровольное сообщение лицом, совершившим административное правонарушение, в орган, уполномоченный осуществлять производство по делу об административном правонарушении, о совершенном административном правонарушении;

4) оказание лицом, совершившим административное правонарушение, содействия органу, уполномоченному осуществлять производство по делу об административном правонарушении, в установлении обстоятельств, подлежащих установлению по делу об административном правонарушении;

5) предотвращение лицом, совершившим административное правонарушение, вредных последствий административного правонарушения;

6) добровольное возмещение лицом, совершившим административное правонарушение, причиненного ущерба или добровольное устранение причиненного вреда;

7) добровольное исполнение до вынесения постановления по делу об административном правонарушении лицом, совершившим административное правонарушение, предписания об устранении допущенного нарушения, выданного ему органом, осуществляющим государственный контроль (надзор) и муниципальный контроль;

8) совершение административного правонарушения в состоянии сильного душевного волнения (аффекта) либо при стечении тяжелых личных или семейных обстоятельств;

9) совершение административного правонарушения несовершеннолетним;

10) совершение административного правонарушения беременной женщиной или женщиной, имеющей малолетнего ребенка.

«»2. Судья, орган, должностное лицо, рассматривающие дело об административном правонарушении, могут признать смягчающими обстоятельства, не указанные в настоящем Кодексе или в законах субъектов Российской Федерации об административных правонарушениях.

«»3. Настоящим Кодексом могут быть предусмотрены иные обстоятельства, смягчающие административную ответственность за совершение отдельных административных правонарушений, а также особенности учета обстоятельств, смягчающих административную ответственность, при назначении административного наказания за совершение отдельных административных правонарушений.

Вам помог ответ?ДаНет

Прокуратура возбудила административные дела после пожаров на мусорных полигонах Новосибирска

В Новосибирске прокуратура провела проверку на полигонах «Левобережный» и «Гусинобродский» и выявила сокрытие фактов возгорании, сообщает ведомство.

Установлено, что «Спецавтохозяйство», эксплуатирующее полигоны, в марте 2021 года допустило 14 возгораний отходов, задымление рядом находящихся территорий и не информировало об этом уполномоченные органы власти. Кроме того, муниципальное предприятие допустило возгорание в июле. «В атмосферном воздухе выявлено превышение содержания вредных загрязняющих веществ»,— говорится в сообщении.

В связи с этим межрайонная природоохранная прокуратура внесла директору «Спецавтохозяйства» представления. Два человека привлечены к дисциплинарной ответственности. В отношении должностных лиц и юрлица возбуждено восемь административных дел по ст. 8.5, ч. 1, 2 ст. 6.35 КоАП РФ. (сокрытие или искажение экологической информации, несоблюдение санитарно-эпидемиологических требований при обращении с отходами).

Также Росприроднадзор и Роспотребнадзор возбудили в отношении должностных лиц административные дела по ч. 1 ст. 6.3 КоАП РФ (нарушение законодательства в области обеспечения санитарно-эпидемиологического благополучия населения), ч. 4, 5 ст. 8.2 КоАП РФ (несоблюдение требований в области охраны окружающей среды при обращении с отходами производства и потребления).

Как сообщалось ранее, в ночь на 15 июля на полигоне «Левобережный» произошел пожар. Губернатор Новосибирской области Андрей Травников потребовал от мэрии провести внутреннее расследование, выяснить, как организована охрана. «Поджог проспали и героическими усилиями четыре дня его тушили. Тут охраняемый объект, а возгорания происходят регулярно»,— сказал он. Позже мэр Новосибирска Анатолий Локоть заявил, что полигон необходимо консервировать, но закрыть его в настоящее время невозможно.

Подробнее о пожаре — в материале “Ъ-Сибирь” «Новосибирский губернатор поручил мэрии провести расследование из-за пожара на мусорном полигоне».

Екатерина Лукашевич

CoAP Client / Server, реализующий RFC 7252 для языка Go

Я написал крошечный проект как https://github.com/crazydiamondzgy/iot-coap-client-c-sdk, и я тестирую его с калифорнийским сервером, и это правильно.

, когда я тестировал простой сервер canopus, например этот

func main () { сервер: = NewLocalServer ()

  server.Post ("/ v1 / appid / 1", func (req CoapRequest) CoapResponse {
    log.Println ("Привет, звонили")
    PrintMessage (требуется GetMessage ())
    msg: = ContentMessage (req.GetMessage (). MessageId, TYPE_ACKNOWLEDGEMENT)
    msg.SetStringPayload ("Подтверждено:" + req.GetMessage (). Payload.String ())
    res: = NewResponse (сообщение, ноль)

    вернуть res
})

server.Start ()

}

в первый раз, все в порядке, я закрыл свой инструмент и снова открыл для проверки во второй раз бесконечный цикл ошибок дисплея canopus, как показано ниже:

2015/09/18 01:00:47 чтение udp 0.0.0.0:5683: таймаут ввода / вывода 2015/09/18 01:00:47 Это была * net.OpError с таймаутом 2015.09.18 01:00:47 прочитал udp 0.0.0.0: 5683: тайм-аут ввода-вывода 2015/09/18 01:00:47 Это была * net.OpError с таймаутом 2015/09/18 01:00:47 прочитано udp 0.0.0.0:5683: таймаут ввода / вывода 2015/09/18 01:00:47 Это была * net.OpError с таймаутом 2015/09/18 01:00:47 прочитано udp 0.0.0.0:5683: таймаут ввода / вывода 2015/09/18 01:00:47 Это была * net.OpError с таймаутом 2015/09/18 01:00:47 прочитано udp 0.0.0.0:5683: таймаут ввода / вывода 2015/09/18 01:00:47 Это была * net.OpError с таймаутом

, кстати, я меняю такой код, чтобы отобразить код ошибки

  readBuf: = make ([] байт, BUF_SIZE)
для {
    len, addr, err: = conn.ReadFromUDP (readBuf)
    if err == nil {

        msgBuf: = make ([] байт, длина)
        копия (msgBuf, readBuf)


        перейти s.handleMessage (msgBuf, conn, addr)
    } еще {
                switch err: = err. (type) {

                case net.Error:
                    if err.Timeout () {
                    log.Println ("Это была * net.OpError с тайм-аутом")
                    }
                }

                if err! = nil {
                    log.Println (err.Error ())
                }
          }
}

Первая вычислительная модель для идентификации белков, нацеленных на апикопласт, у нескольких видов Apicomplexa

Абстрактные

Фон

Большинство паразитов типа Apicomplexa содержат реликтовую пластиду, происходящую от прокариот, называемую апикопластом.Эта органелла важна не только для выживания паразита, но ее уникальные свойства делают ее идеальной мишенью для лекарств. Большинство белков, связанных с апикопластом, кодируются ядром и нацелены посттрансляционно в просвет органеллы посредством двустороннего сигнального механизма, который требует N-концевого сигнала и транзитного пептида (TP). Попытки определить консенсусный мотив, который универсально идентифицирует TP апикопласта, потерпели неудачу.

Методология / основные выводы

В этом исследовании мы предлагаем обобщенную модель классификации на основе правил для идентификации белков, нацеленных на апикопласты (ApicoTPs), которые используют двусторонний механизм передачи сигналов.Учитывая набор тренировок, специфичный для организма, эта модель, называемая ApicoAP, включает процедуру, основанную на генетическом алгоритме, для адаптации правила различения, которое использует известные характеристики ApicoTP. Производительность ApicoAP оценивается для четырех помеченных наборов данных: Plasmodium falciparum , Plasmodium yoelii , Babesia bovis и Toxoplasma gondii

. ApicoAP повышает точность классификации опубликованного набора данных для P.falciparum до 94%, первоначально 90% использовали PlasmoAP.

Выводы / Значение

Мы представляем параметрическую модель для ApicoTP и процедуру оптимизации параметров модели для данного обучающего набора. Основным преимуществом этой модели является то, что ее можно настроить для разных геномов паразитов. Программное обеспечение для прогнозирования ApicoAP доступно на http://code.google.com/p/apicoap/ и http://bcb.eecs.wsu.edu.

Образец цитирования: Cilingir G, Broschat SL, Lau AOT (2012) ApicoAP: первая вычислительная модель для идентификации белков, нацеленных на апикопласт, у нескольких видов Apicomplexa.PLoS ONE 7 (5): e36598. https://doi.org/10.1371/journal.pone.0036598

Редактор: Гордон Лэнгсли, Национальный институт санте и медицинских исследований — Институт Кочина, Франция

Поступила:

21 декабря 2011 г .; Одобрена: 6 апреля 2012 г .; Опубликован: 4 мая 2012 г.

Авторские права: © 2012 Cilingir et al. Это статья в открытом доступе, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника.

Финансирование: Авторы выражают признательность за поддержку GC Фондом Карла М. Хансена. Финансирование было предоставлено Wellcome Trust GR075800M (AOTL) и Соглашением о сотрудничестве 58-5348-7-528 (AOTL) Министерства сельского хозяйства и сельскохозяйственных исследований США (USDA-ARS). Финансирующие организации не играли никакой роли в дизайне исследования, сборе и анализе данных, принятии решения о публикации или подготовке рукописи.

Конкурирующие интересы: Авторы заявили об отсутствии конкурирующих интересов.

Введение

Апикопласт — это реликтовая пластида, которая находится у большинства паразитов типа Apicomplexa [1], [2]. К этому типу относятся Plasmodium falciparum , возбудитель наиболее смертоносной формы малярии, Plasmodium yoelii , другой вызывающий малярию агент, и Toxoplasma gondii и Babesia bovis , вызывающие токсоплазмоз и бабезиоз соответственно. . Апикопласт — важная органелла для выживания этих паразитов [3], [4].Более того, многие белки и пути апикопластов обладают прокариотическими характеристиками из-за родственных связей органелл с бактериями [1], [5]. Поскольку эти белки и пути либо отсутствуют, либо расходятся с таковыми у его эукариотического хозяина, они рассматриваются как многообещающие мишени для лекарств с минимальными побочными эффектами для инфицированного хозяина [6], [5]. Большинство белков апикопласта кодируются ядром и нацелены посттрансляционно в просвет органеллы [7] — [10]. Понимание метаболической активности, осуществляемой в апикопласте, необходимо для идентификации мишени лекарственного средства, и это требует способности обнаруживать сигналы нацеливания на апикопласт в белках.

Импорту белка в просвет апикопласта способствует двусторонний сигнальный механизм, который требует N-концевого сигнального пептида (SP), за которым следует транзитный пептид (TP) [9]. Хотя могут существовать и другие механизмы [11], наиболее легко распознать двусторонний сигнальный механизм. Существуют хорошо зарекомендовавшие себя алгоритмы прогнозирования для определения существования SP в последовательности белка, независимого от организма, которому он принадлежит [12] — [15]. Напротив, не существует установленного вычислительного метода, который определяет наличие TP у нескольких организмов.Фактически, попытки определить консенсусный мотив, который универсально идентифицирует TPs апикопласта, потерпели неудачу, потому что предпочтительные аминокислоты в TP областях находятся под сильным влиянием смещения кодонов Adenine-Thymidine (AT) паразитарных геномов [16]. Например, геном P. falciparum примерно на 80% обогащен AT [16], а в TP апикопласта преобладают такие аминокислоты, как аспарагин (N) и лизин (K), которые используют исключительно кодоны, лишенные гуанина и цитозина. . PlasmoAP, метод прогнозирования на основе правил, использует это смещение и предполагает, что ожидаемая область TP (определяемая как область, которая начинается после прогнозируемого сайта расщепления SP с отсечкой в 80 аминокислот) белков, нацеленных на апикопласт (ApicoTPs). ) должен содержать NK-обогащенную подобласть с соотношением основных и кислых аминокислот, по крайней мере, от 5 до 3 [17].Применение этого метода к другим апикомплексам с более сбалансированным содержанием AT не считается надежным. В результате применение PlasmoAP к геному Babesia bovis выявило лишь несколько кандидатов ApicoTPs по сравнению с> 460 предсказанными ApicoTPs в P. falciparum [18]. С завершением последовательности нескольких геномов Apicomplexan возникает острая необходимость в вычислительном методе обнаружения ApicoTP, который применим к разным организмам, а не к одному модельному организму.

PATS [19] и PlasmoAP [17] — единственные описанные в литературе вычислительные методы, которые обнаруживают участки TP в последовательностях белков. Эти два метода специально разработаны для протеома P. falciparum . PATS следует подходу черного ящика, основанному на обучении нейронной сети по функциям, основанным на содержании аминокислот, собранных из ожидаемой области TP (определяемой как область, которая начинается после прогнозируемого сайта расщепления SP с отсечкой в 78 аминокислот) .В отличие от PlasmoAP, PATS предлагает только прогнозы, не обеспечивая понимания реального механизма прогнозирования. Как метод, основанный на правилах, PlasmoAP имеет преимущество перед PATS в том смысле, что он предлагает понимание основного механизма таргетинга и позволяет формулировать проверяемые гипотезы.

В этой статье мы предлагаем обобщенную модель классификации на основе правил для идентификации ApicoTP, которые используют двусторонний механизм передачи сигналов. На основе только известных характеристик ApicoTP строится параметрическая модель.Учитывая обучающий набор, специфичный для организма, наша модель, ApicoAP для APICO mplexan A picoplast P roteins, использует процедуру, основанную на генетическом алгоритме, для адаптации правила различения, которое максимизирует производительность прогнозирования и обобщения для данного установленный. Преимущество ApicoAP заключается в том, что он настраивается для разных организмов, когда доступны обучающие данные.

Материалы и методы

Выбор классификационной модели

С вычислительной точки зрения предсказание данного белка как ApicoTP или не-ApicoTP может быть сформулировано как проблема бинарной классификации, для которой мы выбираем ApicoTP в качестве положительного класса.Стоит отметить, что мы определяем класс ApicoTP так, что белки, локализующиеся во многих органеллах, включая апикопласт, являются членами этого класса в дополнение к белкам, локализованным только в апикопласте. В типичной настройке контролируемого обучения обучающий набор, содержащий положительные и отрицательные помеченные экземпляры, используется для изучения сопоставления от входа к выходу. В нашем случае цель состоит в том, чтобы изучить сопоставление последовательностей белков с метками двоичных классов: ApicoTP и не-ApicoTP. Наш подход машинного обучения к этой цели состоит в том, чтобы принять параметрическую модель для определения этого сопоставления и оценки параметров модели с использованием обучающего набора, чтобы минимизировать ошибку для оценок параметров.Этот процесс оценки часто называют обучением. В результате обучения создается модель с конкретными параметрами, другими словами, классификатор, который затем может использоваться для прогнозирования меток для новых экземпляров [20].

После некоторого размышления мы выбрали подход, основанный на правилах, аналогичный тому, который использовали разработчики PlasmoAP [17], в качестве основы для нашей модели классификации. Свойства ApicoTP были использованы для построения обобщенного правила, определяемого набором параметров. После завершения обучения с помощью генетического алгоритма полученный классификатор затем использовался для предсказания последовательности белка как ApicoTP или не-ApicoTP.Прежде чем объяснять детали нашего обобщенного определения правила, мы обсудим известные свойства ApicoTP, которые лежат в основе нашей модели.

Свойства белков, нацеленных на апикопласт (ApicoTPs).

Типичный кодируемый ядром ApicoTP содержит область N-концевого сигнального пептида (SP), за которой следует область транзитного пептида (TP) и зрелый белок. SP удаляется во время ко-трансляционного импорта в эндоплазматический ретикулум (ER), а TP, который направляет белок в апикопласт, удаляется из зрелого белка внутри просвета апикопласта [9], [21].

ТП апикопласта сильно различаются по длине и смещены в сторону полярных (предпочтительно положительный заряд), основных и гидрофильных аминокислот [17], [22]. Недавнее исследование, проведенное [23], показывает, что TPs функционально неупорядочены и, следовательно, смещены в сторону аминокислот с низкой спиральностью. Кроме того, было показано, что отсутствие отрицательного заряда, другими словами истощение кислотных остатков, важно для достоверности транзитных пептидов [17], [22].

Разница в длине между TP-областями известных ApicoTP указывает на возможность того, что меньшая подобласть возможно большего TP используется апикопластом для распознавания.Можно ожидать, что эта меньшая подобласть (далее именуемая шаблоном p ) будет воплощать вышеупомянутые свойства областей TP. PlasmoAP использует эту идею для поиска участка из 40 аминокислот в ожидаемой области TP (с отсечкой в 80 аминокислот), которая обогащена и истощена определенными аминокислотными группами. Выбор этих аминокислотных групп и значений отсечения был выполнен только для модельного организма P. falciparum , что является основным ограничением PlasmoAP для других организмов.

Обобщенная модель для белков, нацеленных на апикопласт (ApicoTPs).

Схематическое представление типичного ApicoTP приведено на рисунке 1. Поскольку длина области TP может быть переменной и в большинстве случаев ее точная длина неизвестна, вводится область r , которая представляет ожидаемую область TP. Область r начинается сразу после предсказанного сайта расщепления SP и имеет длину не более L _r . Предполагается, что шаблон p с длиной L _p существует в области r , которая содержит основную информацию, которая указывает, является ли рассматриваемый белок ApicoTP.Образец p представляет собой просто непрерывную подобласть области r , обогащенную аминокислотами, имеющими низкую спиралевидность или полярными (предпочтительно положительный заряд), основными или гидрофильными и обедненными кислотными и отрицательными аминокислотами. {H, K, R} — полярно-положительные, основные и высокогидрофильные аминокислоты. {N, Q} — это полярно-нейтральные и высокогидрофильные аминокислоты. {S, P, Y} — это умеренно гидрофильные аминокислоты с низкой спиральностью.Мы называем эти восемь аминокислот предпочтительным набором остатков (PRS) . {E, D} — полярно-отрицательные и кислые аминокислоты с высокой спиральностью. Мы называем их набором для предотвращения остатков (ARS) . Мы определили эти наборы, используя прогнозы склонности к спирали Chou-Fasman [24] и индекс гидропатии Kyte-Doolittle [25].

Рисунок 1. Схематическое изображение типичного апикопласт-нацеленного белка (ApicoTP).

Показан типичный ApicoTP с определенными областями r и p , где r — это ожидаемая область TP, которая начинается сразу после прогнозируемого сайта расщепления SP, а p — это шаблон, который содержит основную информацию для прогнозирования. ApicoTP.Шаблон p — это просто смежная подобласть области r .

https://doi.org/10.1371/journal.pone.0036598.g001

Оценка предпочтительного набора остатков (PRSS) и Оценка исключения набора остатков (ARSS) количественно определяют наличие PRS и ARS элементы в произвольной области s . Уравнения (1) и (2) дают функциональные формы этих величин, где f (x, s) — частота аминокислотного остатка x в области s . PRSS и ARSS — это просто взвешенные суммы этих частот. Наборы весов w ₁ и w ₂ определяют относительное влияние остатков в оценочных функциях. Когда вес равен 0, частота соответствующего остатка не влияет на счет, а когда он равен 1, он будет иметь максимальный эффект. (1) (2)

Как указано ранее, предполагаемая область TP r , как предполагается, содержит непрерывную подобласть p длиной L _p , которая воплощает основную информацию для идентификации ApicoTP.Мы называем набор, содержащий все смежные подобласти длиной L _p in r как S _p . В ApicoTP, p должен иметь высокий PRSS и относительно низкий ARSS . Предполагая линейную зависимость между PRSS и ARSS , функция p-критерия , заданная уравнением. (3) определяет критерий выбора p из S _p . По существу, оптимальным выбором является подобласть с наивысшим соотношением предпочтительных остатков к остаткам, которых можно избежать.(3)

Предельное значение lv является оценкой PRSS , когда e процентов остатков в области s длиной L _s происходят из набора предпочтительных остатков (PRS) . Причина включения этого предельного значения состоит в том, чтобы гарантировать, что минимальное количество элементов из PRS присутствует в подобласти p . Единственного отсутствия избегаемых остатков недостаточно для того, чтобы белок был ApicoTP; также требуется минимальное количество предпочтительных остатков.Уравнение (4) дает функциональную форму лв . (4)

Модель классификации на основе правил для ApicoTP.

Обобщенная модель для ApicoTP, обсуждаемая выше, определяет отображение последовательностей белка в значения p-критерия . Чтобы использовать эту модель в качестве классификатора, необходимо определить пороговое значение для значений p-критерия , которое отделяет ApicoTP от не-ApicoTP. Это достигается за счет обратной связи с обучающей выборкой. Мы исследуем возможные местоположения порога и выбираем то, которое максимизирует производительность прогнозирования результирующего классификатора для обучающего набора.Возможные местоположения для порога — это средние точки каждой смежной пары из значений p-критерия в отсортированном порядке. Полученный в результате классификатор на основе правил классифицирует последовательность белка со значением p-критерия , превышающим или равным пороговому значению, как ApicoTP.

Геометрическая интерпретация модели классификации ApicoTP.

PRSS и ARSS , определяемые уравнениями. (1) и (2), соответственно, связанные с подобластью p для данной последовательности белка, отображают последовательность в плоскость, в которой различающая линия разделяет ApicoTP и не-ApicoTP.Последовательности белков отображаются в точку на плоскости PRSS — ARSS , где те, которые появляются на или над различающей линией, предположительно являются ApicoTP. Предельное значение лв , определяемое формулой. (4), определяет PRSS — перехват различающей линии. Пороговое значение для значений p-критерия , которое определяется посредством обратной связи от обучающего набора, дает наклон этой линии.

Если ARSS равен нулю, а PRSS больше или равен предельному значению lv , последовательность должна отображаться в область ApicoTP плоскости PRSS — ARSS , но p -критерий значение не определено, потому что знаменатель в формуле.(3) равно нулю. Для таких случаев мы устанавливаем p-критерий как достаточно большой, чтобы гарантировать отображение последовательности в область ApicoTP. Когда PRSS меньше, чем lv , а ARSS равен нулю, p-критерий устанавливается достаточно низким, чтобы гарантировать отображение последовательности в не-ApicoTP-область ниже различающей линии.

Параметры модели классификации на основе правил, используемой в ApicoAP, включая веса, L _p , L _r и e , оптимизируются с использованием генетического алгоритма, как описано ниже, но перед обсуждением В нашем методе оптимизации мы обсуждаем другое требование для идентификации ApicoTP с двусторонним сигнальным механизмом — наличие сигнального пептида.

Идентификация сигнального пептида.

Неявно в нашей обобщенной модели является то, что ApicoTP содержит SP, потому что ожидаемая область TP r начинается с предсказанного сайта расщепления SP. Мы использовали SignalP 3.0 [26] для предсказания сайта расщепления SP, поскольку это инструмент, обычно описываемый в литературе для геномов апикомлексанов. Мы рассмотрели возможность использования самой последней версии этого инструмента, SignalP 4.0 [12], которая, как полагают, лучше справляется с различением областей SP от трансмембранных доменов, существующих ниже N-конца последовательности.Однако мы заметили, что SignalP 4.0 предсказывает значительно меньше SP, чем SignalP 3.0 для геномов Apicomplexan. Например, согласно SignalP 3.0 геном P. falciparum содержит около 1100 SP, но SignalP 4.0 идентифицирует только около 600 SP. Ни один из этих инструментов не обучен и не протестирован на геномах Apicomplexan, поскольку экспериментально подтверждено, что ни один белок Apicomplexan не содержит SP. Необходимы дальнейшие исследования геномов Apicomplexan для оценки возможных причин разницы в количестве прогнозов.

Оптимизация параметров модели

Показатель эффективности прогнозирования, рассчитанный с заданным помеченным набором данных, демонстрирует, насколько хорошо модель классификации работает с доступными данными, но не предсказывает, насколько хорошо классификатор, как можно ожидать, будет работать на практике. Вместо этого для нашего критерия оптимизации мы используем ожидаемую прогнозируемую производительность модели , то есть насколько хорошо она должна быть обобщена на новые экземпляры данных; это можно оценить с помощью процедуры перекрестной проверки.При n-кратной перекрестной проверке заданный набор данных случайным образом делится на n подмножеств равного размера. Классификатор обучается n раз, выделяя один отдельный набор для проверки и используя оставшиеся n-1 наборы для обучения. Средняя производительность прогнозирования для наборов проверки дает оценку ожидаемой производительности прогнозирования классификатора [20].

Мы используем коэффициент корреляции Мэтьюза (MCC) в качестве показателя эффективности; MCC известен как сбалансированная мера, потому что он одинаково взвешивает истинно положительное предсказание и истинно отрицательное предсказание, независимо от того, насколько несбалансированным может быть набор тестов [27].Более часто используемый показатель эффективности, точность, смещен в сторону классификаторов, которые, как правило, лучше работают с большинством классов. Модель классификации на основе правил, используемая в ApicoAP, требует нескольких параметров: веса, которые используются для расчета PRSS и ARSS , длины области L _r , длины шаблона L _p и предельный процент e , из которого определяется предельное значение lv .Процедура оптимизации, основанная на генетическом алгоритме, применяется для определения набора параметров, которые создают модель с максимальной ожидаемой производительностью прогнозирования. Проблема выбора наилучших параметров модели классификации среди всех возможностей характеризуется как задача поиска, в которой пространство параметров исследуется с использованием ожидаемых характеристик прогнозирования в качестве целевой функции, вычисленной с использованием меры MCC.

Краткий обзор генетических алгоритмов.

Генетический алгоритм (ГА) — это метод эвристического поиска, вдохновленный дарвиновской эволюцией [28].Основываясь на принципе «выживания наиболее приспособленных», ГА поддерживает набор возможных решений, называемых индивидуумами, представленных набором генов, и применяет операции комбинирования и трансформации к индивидуумам, аналогичные операциям кроссовера и мутации в реальных генах. Типичная итерация ГА включает в себя отбор наиболее приспособленных индивидуумов (решения с наивысшими значениями целевой функции), применение операции кроссовера к этим индивидуумам, генерацию случайных мутаций внутри вновь произведенных особей (потомков) и замену процентной доли этих особей. всего населения этими потомками.Это моделирование эволюции экземпляров решения проходит несколько итераций, пока не будет достигнуто условие остановки. На этом этапе алгоритм возвращает оптимальное решение, полученное с помощью итераций.

Сила генетических алгоритмов проистекает из использования основанного на приспособленности отбора и генетических операторов (кроссовер и мутация) во время репродукции [29]. Отбор особей для воспроизводства на основе фитнеса позволяет наиболее приспособленным иметь потомство с помощью оператора кроссовера, который позволяет обмениваться генетической информацией между родителями.Если мы предположим, что каждый индивид в идеале улавливает различные особенности глобального оптимума, объединение частей этих особей от нескольких родителей в одном потомстве значительно ускоряет процесс достижения оптимумов. Это явление известно как неявный параллелизм в ГА [30], [31]. Оператор мутации вносит локальные изменения в потомство, что важно для поддержания исследования в пространстве поиска. Мутации вносят генетическое разнообразие, которое не обязательно присутствует в популяции, но может быть необходимо для достижения глобального оптимума.

В литературе существует множество вариаций ГА. Можно поддерживать одну популяцию или несколько популяций параллельно. Если несколько популяций развиваются параллельно, миграция между ними во время каждой итерации может быть разрешена либо для наиболее приспособленных, либо для случайных особей. На каждой итерации следующая популяция может перекрываться, а может и не совпадать с предыдущей.

Генетический алгоритм для ApicoAP.

В генетическом алгоритме, используемом в ApicoAP, индивидуум представлен набором параметров с действительным знаком, содержащим десять весов, одну длину области L _r , одну длину шаблона L _p и один ограничивающий процентный параметр. и .Чтобы упростить задачу, мы ввели ограничения на возможные значения каждого параметра. Значения веса могут быть 0, 0,5 или 1. Значения длины области могут быть от 60 до 90 с шагом 5. Значения длины шаблона могут быть от 15 до 40 с шагом 1. Предельные процентные значения могут быть от 0,2 до 0,4 с шагом. 0,05. Все диапазоны были определены экспериментально с обучающей частью имеющихся данных. Эксперименты, проведенные с более длинными участками и рисунками, не привели к значительным различиям в правилах или характеристиках, свидетельствующих о том, что выбранная длина является достаточной.

Были определены равномерный кроссовер и точечная мутация, и исходные вероятности кроссовера и мутации были выбраны равными 1,0 и 0,1 соответственно. Были использованы четыре параллельные популяции, содержащие 40 особей, и миграция была разрешена (на каждой итерации) для двух наиболее приспособленных особей. Было установлено, что популяции пересекаются, при этом 15 особей заменяются вновь созданным потомством на всех итерациях. Желательно большое количество популяций с большим количеством индивидуумов, но эффективность вычислительного времени, необходимого для оптимизации, также является проблемой.Процент замещения и предел миграции часто определяют, насколько быстро различия населения сходятся к нулю, но слишком быстрое достижение этого состояния нежелательно, поскольку скорее всего будет достигнут локальный оптимум, а не глобальный. Поддержание разнообразия популяций важно для увеличения вероятности достижения глобального оптимума пространства поиска. Таким образом, при определении параметров существует компромисс между эффективностью времени и сохранением разнообразных популяций.

Чтобы избежать локальных оптимальных ловушек, мы внедрили механизм для мониторинга разнообразия популяций и предприняли превентивные меры, когда это необходимо, путем постепенного увеличения частоты мутаций и изменения критерия перекрестного отбора с наиболее подходящего на случайный.Когда прошло 30 поколений, а оптимальное решение не улучшилось, мы прекратили поиски. Хотя были реализованы дополнительные механизмы, чтобы избежать локальных оптимальных ловушек, было выполнено несколько прогонов, чтобы гарантировать достижение оптимального решения.

Наборы данных

Для оценки эффективности ApicoAP мы использовали пять помеченных наборов белковых последовательностей из P. falciparum , P. yoelii , B. bovis и T. gondii , каждый из которых содержит последовательности одного организма.Мы использовали опубликованный набор данных, использованный при разработке PlasmoAP [17], с единственной целью — сравнить наш метод с их методами. Кроме того, мы собрали новый обучающий набор для белков P. falciparum , который включает недавние экспериментальные данные. Мы также собрали новые тренировочные наборы для P. yoelii , B. bovis и T. gondii . ApiLoc использовался в качестве основного ресурса для поиска экспериментально подтвержденных белков Apicomplexan.

Мы получили экспериментально подтвержденные белки ApicoTP из базы данных ApiLoc (версия 3, http: // apiloc.bio21.unimelb.edu.au) и идентифицировали ортологи этих белков из базы данных OrthoMCL (версия 5) [32]. Белки, подтвержденные как имеющие SP с помощью SignalP 3.0, были использованы в наших позитивных тренировочных наборах. Дополнительные белки были добавлены в наши обучающие наборы из ссылок [17], [33] — [38]. Из-за нехватки экспериментально подтвержденных ApicoTP P. yoelii и B. bovis (подтверждено, что только три белка являются ApicoTP для каждого организма), мы использовали перенос гомологии для создания обучающих наборов разумного размера.CDART (инструмент поиска консервативной доменной архитектуры) [39] был использован для вывода гомологии белков посредством сходства доменной архитектуры. См. Таблицы S1, S2, S3, S4 для получения подробной информации о положительных тренировочных выборках.

Мы получили белки, помеченные как не апикопласты, из базы данных ApiLoc и нашли ортологи, используя базу данных OrthoMCL. Белки, предположительно имеющие SP-область, использовались в наших отрицательных тренировочных наборах. Мы также обнаружили белки, подтвержденные для локализации в местах, отличных от апикопласта, из базы данных ApiLoc.Мы вручную удалили белки, подтвержденная локализация которых не обязательно исключает нацеливание на апикопласты. Например, мы удалили белки, для которых подтверждена локализация в митохондриях, пищевых вакуолях и цитоплазме, поскольку в литературе сообщалось о случаях двойной локализации с участием апикопластов и этих мест. Поскольку очень мало P. yoelii и B. bovis не-ApicoTPs были экспериментально подтверждены, мы добавили белки, помеченные как «вариантный поверхностный антиген эритроцитов», «мерозоитный поверхностный антиген» и «связанный / связанный с rhoptry» отрицательный тренировочные наборы для увеличения их размеров.См. Таблицы S5, S6, S7, S8 для получения подробной информации об отрицательных обучающих выборках.

Все белковые последовательности были получены из EuPathDB (версия 2.13) [40], который является основным хранилищем биологических последовательностей для эукариотических патогенов, таких как Apicomplexans. Таблица 1 показывает разбивку каждого обучающего набора по положительным (предполагаемые ApicoTP) и отрицательным (не-ApicoTP) классам.

Для ApicoAP для обучения использовались только белки, содержащие SP. Опубликованный набор данных белков для P.falciparum содержит 102 не-ApicoTP, из которых 75 не имеют SP. Как и в случае с ApicoAP, PlasmoAP требует, чтобы белок содержал SP для предсказания в качестве ApicoTP. Таким образом, исключение 75 не-ApicoTP не повлияет на сравнение двух методов. Фактически, вполне вероятно, что отрицательный обучающий набор, который включает белки без SP, может сильно завышать фактическую производительность классификатора, учитывая, что цель таких классификаторов состоит в том, чтобы отличать ApicoTP от не-ApicoTP, когда SP присутствует.

Результаты

Оценка ApicoAP

ApicoAP использовался с пятью наборами данных, описанными в предыдущем разделе. Чтобы оценить ожидаемую производительность прогнозирования ApicoAP, использовалась перекрестная проверка 3 × 5. Классификатор на основе правил обучается на подмножестве помеченного набора данных, который будет называться набором для обучения и проверки. Как обсуждалось ранее, это подмножество дополнительно разделено на наборы для обучения и проверки с использованием перекрестной проверки 3 × 5, чтобы облегчить вычисление значения целевой функции на этапе оптимизации параметров.На этом этапе оптимизируются параметры нашего основанного на правилах классификатора, и полученный классификатор применяется к оставшемуся набору (тестовый набор), чтобы оценить производительность модели для неизвестных данных. Для оценки производительности модели использовалось пятнадцать образцов тестового набора. Ожидаемая производительность прогнозирования ApicoAP была рассчитана с использованием коэффициента корреляции Мэтьюза (MCC) путем усреднения значений MCC классификатора по этим выборкам.

Во время оптимизации параметров часто найденный набор параметров с оптимальным целевым значением не является уникальным.Небольшие возмущения одного или нескольких параметров приводят к получению разных наборов параметров с одним и тем же оптимальным целевым значением. Обученные классификаторы с этими наборами параметров иногда обладают разными ожидаемыми характеристиками прогнозирования. В таблице 2 мы приводим средние значения минимальной, максимальной и средней точности, наблюдаемые вместе со стандартными отклонениями. Они отражают наихудший, лучший и наиболее вероятный ожидаемые характеристики прогнозирования соответственно.

Последний классификатор для каждого набора данных использует один набор параметров.Для формирования этого набора параметров мы взяли средние значения отдельных параметров, полученных в ходе процедуры перекрестной проверки. Затем мы скорректировали пороговое значение с учетом всего помеченного набора данных. Обратите внимание, что мерой производительности, использованной для определения порога, также был MCC. Полученные в результате классификаторы для четырех организмов были реализованы в программном обеспечении ApicoAP, используемом для прогнозирования предполагаемых ApicoTP (подробно обсуждается в следующем разделе). В таблице 3 приведена производительность ApicoAP для различных классификаторов.В отличие от значений, приведенных в таблице 2, значения в таблице 3 оценивают не то, насколько хорошо ApicoAP будет работать с неизвестными данными, а скорее, насколько хорошо он работает с доступными помеченными данными.

Сравнение ApicoAP и PlasmoAP для опубликованного набора данных P. falciparum приведено в таблице 4. Значения в таблице 4 показывают, что ApicoAP обеспечивает некоторое улучшение как истинно положительных, так и истинно отрицательных показателей, последнее подразумевает меньшее количество ложных положительные прогнозы.

Прогнозы ApicoAP

После того, как данный обучающий набор используется в модели классификации, получается классификатор на основе правил, который предсказывает ApicoTP, когда выполняются следующие критерии:

Предполагается, что последовательность белка содержит SP.
Область L _r аминокислот, следующая за сайтом расщепления SP, содержит образец из L _p аминокислот со значением p-критерия , превышающим или равным определенному порогу.

Классификаторы, полученные с использованием данных обучения, доступных для P. falciparum , P. yoelii , B. bovis и T. gondii , доступны в пакете программ ApicoAP. Эти классификаторы использовались для прогнозирования ApicoTP, как описано в этом разделе.

Предполагается, что многие белки, экспрессируемые в геномах P. falciparum , P. yoelii , B. bovis и T. gondii , содержат SP.Количество этих белков для каждого организма, за исключением тех, которые используются для обучения и тестирования, приведено в таблице 5. Количество белков, которые ApicoAP предсказал как ApicoTP, также указано в таблице 5.

Из 1046 SP-содержащих белков P. falciparum , PlasmoAP предсказывает, что 358 являются ApicoTP. По прогнозам ApicoAP, из этих 358 261 (261/358 = 73%) также будут ApicoTP. Остальные SP-содержащие белков P. falciparum (1046-358 = 688), по прогнозам PlasmoAP, не являются ApicoTP.ApicoAP также прогнозирует, что из этих 688 407 (407/688 = 60%) не являются ApicoTP. Остается 281 (688-407 = 281), которые определены ApicoAP как дополнительные предполагаемые ApicoTP.

Из-за отсутствия в литературе инструментов прогнозирования для B. bovis , P. yoelii и T. gondii , мы не смогли сравнить наши результаты прогнозирования с эталонными. Списки предполагаемых ApicoTP, идентифицированных ApicoAP для четырех рассматриваемых организмов, доступны в таблицах S9, S10, S11, S12.

Оптимизированные параметры модели для классификаторов ApicoAP

На фиг. 2 представлены частотные распределения для предпочтительных и исключаемых остатков в пределах p областей обучающих последовательностей для каждого организма. Эти области обнаруживаются путем применения последних классификаторов ApicoAP к последовательностям. В целом, оценки весовых параметров оказываются пропорциональными разнице между частотой остатков для положительных и отрицательных множеств.Для P. falciparum лизин (K), по-видимому, имеет наибольший эффект среди аминокислот, вносящих вклад в оценку набора предпочтительных остатков ( PRSS ). Наибольшее влияние на PRSS для классификаторов P. yoelii и B. bovis оказывает аргинин (R), а для классификатора T. gondii — серин (S). Все эти оценки согласуются с приведенными гистограммами.

Расчетный параметр длины области r оказался равным 60, 62, 70 и 88 для P.falciparum , P. yoelii , B. bovis и T. gondii соответственно. Расчетная длина области p оказалась равной 31, 36, 35 и 28 для P. falciparum , P. yoelii , B. bovis и T. gondii соответственно.

Рис. 2. Усредненные частотные распределения предпочтительных и избегаемых остатков для областей p обучающих последовательностей.

На этом рисунке представлены частотные распределения предпочтительных и исключаемых остатков для областей p обучающих последовательностей для каждого организма. p — это смежная подобласть длиной L _p в ожидаемой области TP r , которая имеет максимальное значение p-критерия , заданное уравнением. (3). Конечные классификаторы ApicoAP используются для идентификации p областей по каждой последовательности. Подсчеты остатков по отдельным областям p делятся на длину областей p , и полученные значения усредняются по положительным и отрицательным тренировочным наборам для каждого организма.

https://doi.org/10.1371/journal.pone.0036598.g002

На рисунке 3 показано, как данные тренировки отображаются на плоскость PRSS-ARSS при применении окончательных классификаторов. Различающая линия показана, где точка пересечения PRSS этой линии соответствует расчетному предельному значению lv , заданному уравнением. (4), а наклон линии соответствует расчетному пороговому значению для значения p-критерия , заданного уравнением.(3). Одно интересное наблюдение заключается в том, что многие из белков T. gondii содержат p областей без кислотных остатков, то есть ARSS равен нулю. Ошибочная классификация отрицательных данных обучения, по-видимому, связана с этим типом области p .

Рис. 3. Обучающие данные, отображенные на плоскость PRSS-ARSS с использованием окончательных классификаторов ApicoAP.

На этом рисунке показано, как данные обучения отображаются на плоскость PRSS-ARSS , когда применяются окончательные классификаторы ApicoAP.Шкала предпочтительного набора остатков (PRSS) и Показатель набора избегаемых остатков (ARSS) количественно определяют наличие предпочтительного набора остатков (PRS) и элементов набора избегаемых остатков (ARS) в областях p области обучающие последовательности для каждого организма. См. Уравнения. (1) и (2) для определений. Различающие линии показаны на каждом графике, где точка пересечения PRSS каждой линии соответствует расчетному предельному значению lv , заданному уравнением.(4), а наклон каждой линии соответствует расчетному пороговому значению для значений p-критерия , заданных уравнением. (3).

https://doi.org/10.1371/journal.pone.0036598.g003

В дополнение к содержанию областей p , представленных на рисунке 2, мы проанализировали расположение этих регионов среди наших положительных данных по тренировкам (с мощностью 144). Примерно в 55% последовательностей идентифицированная область p (с максимальным значением p-критерия ) появляется сразу после или в пределах 5 остатков от предполагаемого сайта расщепления SP.Для остальных последовательностей область p появляется (в среднем) на расстоянии 20 остатков от сайта расщепления SP. Мы проанализировали область между предсказанным сайтом расщепления SP и началом области p , которую мы называем областью pre-pattern . Для того чтобы учесть ошибки предсказания сайта расщепления SP, мы предполагаем, что область предварительного паттерна существует, когда область p появляется на 5 или более остатков от предсказанного сайта расщепления SP. Наша цель состояла в том, чтобы сравнить частоты кислотных остатков (D и E) в этих двух областях.Была применена проверка гипотез, чтобы подтвердить, что среднее значение разницы отличается от нуля. Для этого теста и для всех последующих интервальных оценок мы использовали значение p, равное 0,05. Было обнаружено, что частота кислотных остатков в области перед паттерном выше, чем в области p , на 8-11% в 78% этих белков. Наибольшая и наименьшая наблюдаемые различия составили 33% и 1% соответственно.

Мы повторили тот же анализ на подмножестве наших положительных обучающих данных, содержащих только экспериментально подтвержденные ApicoTP (с мощностью 70).В 43% из них существовала область перед шаблоном . Было обнаружено, что частота кислотных остатков в области перед паттерном выше, чем в области p , на 6-11% в 90% этих белков. Подобные тенденции наблюдались и среди ApicoTP, предсказанных ApicoAP.

Экспериментальные данные для транзитных пептидов (TP) T. gondii показывают, что отсутствие кислотных остатков в N-концевой части TP важно для верности TP, даже более важно, чем наличие положительного заряда [21].Тонкин и др. в этих экспериментах использовали ацильный белок-носитель (ACP) из T. gondii . ApicoAP не идентифицирует в этом конкретном белке предварительную модель области , что означает, что область p расположена сразу после предсказанного сайта расщепления SP. Это указывает на то, что механизм прогнозирования ApicoAP, полностью основанный на области p , которая не обязательно появляется на N-концевой части TP, не противоречит экспериментальным результатам.

Обсуждение

Апикопласт — это уникальная органелла, которая находится в группе эукариотических паразитов, известных как Apicomplexa, которые ответственны за широкий спектр серьезных заболеваний среди людей и домашнего скота. Поскольку устойчивость паразитов Apicomplexan к обычно используемым лекарствам возрастает, важно найти новые мишени для лекарств. Апикопласт является важной органеллой для выживания этих паразитов и, учитывая его прокариотическое происхождение, рассматривается как многообещающая мишень для лекарств.Большинство белков апикопласта кодируются ядром и посттрансляционно нацелены на органеллу апикопласта. Экспериментальная идентификация белков, нацеленных на апикопласты (ApicoTPs) — дорогостоящая и трудоемкая задача. Точные методы прогнозирования in silico необходимы для ускорения идентификации перспективных мишеней для лекарств.

Вычислительный подход, доступный для общегеномного предсказания ApicoTP, известный как PlasmoAP [17], был разработан для идентификации ApicoTP в P.falciparum и, следовательно, применение к другим Apicomplexa считается ненадежным. Мы разработали альтернативную вычислительную модель ApicoAP. В ApicoAP мы проводим систематический поиск в пространстве правил, используя ожидаемую производительность прогнозирования правила на обучающем наборе в качестве критерия оптимизации. Пространство правил формализовано нашим параметрическим определением правила, а оптимизация выполняется с использованием генетического алгоритма. Основным преимуществом нашего подхода к задаче прогнозирования ApicoTP в масштабе всего генома является то, что он не ограничен одним организмом, а может быть настроен для разных организмов, для которых доступны данные обучения.

Производительность ApicoAP оценивается для помеченных наборов данных белков P. falciparum , P. yoelii , B. bovis и T. gondii , один из которых является набором данных, опубликованным совместно с PlasmoAP [17] . В оценке используется перекрестная проверка, общий подход, используемый для проверки моделей классификации. Процедура перекрестной проверки обеспечивает оценку эффективности прогнозирования модели путем систематического сохранения части помеченного набора данных и использования этой части для тестирования модели, полученной с использованием оставшейся части набора данных.Ожидаемая точность прогнозов, т. Е. Точность для неизвестных белков, а не точность помеченных данных, для текущих классификаторов ApicoAp для P. falciparum , P. yoelii , B. bovis и T. gondii составляют 87%, 85%, 82% и 83% соответственно. Наилучшая ожидаемая точность прогнозирования достигается при использовании обучающего набора P. falciparum , самого большого из четырех обучающих наборов. Чем больше набор обучающих данных, тем более надежным и точным будет полученный классификатор.При добавлении большего количества обучающих данных классификаторы могут быть обновлены для обеспечения большей точности. Хотя четыре классификатора специально предназначены для использования с четырьмя описанными видами, они могут помочь в идентификации потенциальных ApicoTP для родственных видов, когда смещения AT-кодонов соответствующих геномов схожи.

В этой статье мы представляем ApicoAP, первую вычислительную модель, способную идентифицировать ApicoTPs у нескольких видов Apicomplexa. Кроме того, мы предоставляем удобную программу на основе Python, которая включает классификаторы ApicoAP для P.falciparum , P. yoelii , B. bovis и T. gondii . ApicoAP предоставляет среду обучения для прогнозирования ApicoTP, основанную на систематическом подходе к поиску основанного на правилах классификатора с наилучшей ожидаемой производительностью прогнозирования по обучающему набору. Эта структура может быть применена к другим областям, для которых желательно иметь различающий автоматизированный процесс поиска правил.

Благодарности

Авторы благодарны за подробные рецензии, в результате которых рукопись была значительно улучшена.

Вклад авторов

Задумал и спроектировал эксперименты: AOTL. Проанализированы данные: GC SLB AOTL. Написал статью: GC SLB AOTL. Разработанный алгоритм прогнозирования: GC SLB. Разработал и написал программное обеспечение: GC.

Ссылки

1. McFadden GI, Reith ME, Munholland J, Lang-Unnasch N (1996) Plastid in Human Parasites. Природа. 381 (6582): 482.
2. Келер С., Делвиче С.Ф., Денни П.В., Тилни Л.Г., Вебстер П. и др. (1997) Пластида вероятного происхождения зеленых водорослей у паразитов Apicomplexan.Наука. 275 (5305): 1485–9.
3. Fichera ME, Roos DS (1997) Пластидная органелла как лекарственная мишень у апикомплексных паразитов. Природа. 390: 407–409.
4. He CY, Shaw MK, Pletcher CH, Striepen B, Tilney LG и др. (2001) Дефект сегрегации пластид у простейшего паразита Toxoplasma gondii. EMBO J. 20: 330–339.
5. Ральф С.А., Ван Дурен Г.Г., Валлер Р.Ф., Кроуфорд М.Дж., Фраунхольц М.Дж. и др. (2004) Метаболические карты и функции апикопласта Plasmodium falciparum.Nat Rev Microbiol. 2: 203–216.
6. McFadden GI, Roos DS (1999) Пластиды Apicomplexan как мишени для лекарств. Trends Microbiol. 7: 328–333.
7. Уоллер Р.Ф., Килинг П.Дж., Дональд Р.Г.К., Стрипен Б., Хэндман Э. и др. (1998) Белки, кодируемые ядром, нацелены на пластиду у Toxoplasma gondii и Plasmodium falciparum. Proc Natl Acad Sci U S A 95: 12352–12357.
8. Roos DS, Crawford MJ, Donald RG, Kissinger JC, Klimczak LJ, et al. (1999) Происхождение, нацеливание и функция апикомплексной пластиды.Curr Opin Microbiol. 2 (4): 426–32.
9. Waller RF, Reed MB, Cowman AF, McFadden GI (2000) Доставка белка в пластиду Plasmodium falciparum осуществляется через секреторный путь. EMBO J. 19: 1794–1802.
10. van Dooren GG, Walker RF, Joiner KA, Roos DS, McFadden GI (2000) Пробки: транспорт белка в Plasmodium falciparum. Паразитол сегодня. 16: 421–427.
11. Lim L, Kalanon M, McFadden GI (2009) Новые белки в мембранах апикопласта: время переосмыслить нацеливание на белок апикопласта.Trends Parasitol. 25 (5): 197–200.
12. Петерсен TN, Brunak S, von Heijne G, Nielsen H (2011) SignalP 4.0: различение сигнальных пептидов из трансмембранных областей. Нат методы. 8 (10): 785–6.
13. Emanuelsson O, Brunak S, von Heijne G, Nielsen H (2007) Определение местонахождения белков в клетке с помощью TargetP, SignalP и связанных с ними инструментов. Nat Protoc. 2 (4): 953–71.
14. Reynolds SM, Käll L, Riffle ME, Bilmes JA, Noble WS (2008) Трансмембранная топология и прогнозирование сигнальных пептидов с использованием динамических байесовских сетей.PLoS Comput Biol 4 (11): e1000213.
15. Käll L, Krogh A, Sonnhammer EL (2007) Преимущества комбинированной трансмембранной топологии и предсказания сигнального пептида — веб-сервер Phobius. Nucleic Acids Res. 35 (проблема с веб-сервером). С. W429–32.
16. Тонкин CJ, Kalanon M, McFadden GI (2008) Нацеленность белка на пластиду малярийного паразита. Движение. 9 (2): 166–75.
17. Foth BJ, Ralph SA, Tonkin CJ, Struck NS, Fraunholz M, et al. (2003) Рассечение апикопластов у малярийного паразита Plasmodium falciparum.Наука. 299: 705–708.
18. Брайтон К.А., Лау А.О., Херндон Д.Р., Ханник Л., Каппмайер Л.С. и др. (2007) Последовательность генома Babesia bovis и сравнительный анализ apicomplexan hemoprotozoa. PLoS Pathog. 3 (10): 1401–13.
19. Zuegge J, Ralph S, Schmuker M, McFadden GI, Schneider G (2001) Расшифровка сигналов нацеливания на апикопласт — выделение признаков из ядерно-кодированных предшественников белков апикопласта Plasmodium falciparum. Ген. 280 (1-2): 19-26.
20.Этхем Алпайдин (2010) Введение в машинное обучение. MIT Press. 9 п.
21. van Dooren GG, Su V, D’Ombrain MC, McFadden GI (2002) Обработка лидерной последовательности апикопласта в Plasmodium falciparum и идентификация предполагаемого фермента расщепления лидера. J Biol Chem. 277 (26): 23612–9.
22. Tonkin CJ, Roos DS, McFadden GI (2006) N-концевые положительно заряженные аминокислоты, но не их точное положение, важны для верности транзитного пептида апикопласта в Toxoplasma gondii.Мол Биохим Паразитол. 150 (2): 192–200.
23. Gallagher JR, Matthews KA, Prigge ST (2011) Транзитные пептиды апикопластов Plasmodium falciparum неструктурированы in vitro и во время импорта апикопластов. Движение. 12 (9): 1124–38.
24. Prevelige PE, Fasman GD (1989) Предсказание Чоу-Фасмана вторичной структуры. В: Фасман Г.Д., редактор. Прогнозирование структуры белков и принципы конформации белков. Нью-Йорк: Пленум. С. 1–91.
25.Kyte J, Doolittle RF (1982) Простой метод отображения гидропатического характера белка. J Mol Biol. 157 (1): 105–32.
26. Bendtsen JD, Nielsen H, von Heijne G, Brunak S (2004) Улучшенное предсказание сигнальных пептидов: SignalP 3.0. J Mol Biol. 340 (4): 783–95.
27. Baldi P, Brunak S, Chauvin Y, Andersen CA, Nielsen H (2000) Оценка точности алгоритмов прогнозирования для классификации: обзор. Биоинформатика. 16 (5): 412–24.
28. Холланд Дж. Х. (1992) Генетические алгоритмы. Scientific American. 267 (1): 66–72.
29. Келли Дж. Д., Дэвис Л. (1991) Гибридный генетический алгоритм для классификации. В Proc. IJCAI’91. 2: 645–650.
30. Холланд Дж. Х. (1992) Адаптация в естественных и искусственных системах: вводный анализ с приложениями к биологии. MIT Press. 71 с.
31. Митчелл М., Холланд Дж. Х., Форрест С. (1993) Когда генетический алгоритм превзойдет лазание по холмам? В Proc.НИПС’93. 6: 51–58.
32. Chen F, Mackey AJ, Stoeckert CJ, Roos DS (2006) OrthoMCL-DB: запрос всеобъемлющей многовидовой коллекции групп ортологов. Nucleic Acids Res. 34: D363–8.
33. Fleige T, Limenitakis J, Soldati-Favre D (2010) Apicoplast: сохраните или оставьте. Микробы заражают. 12 (4): 253–62.
34. Кумар А., Танвир А., Бисвас С., Рам Э.В., Гупта А. и др. (2010) Ядерно-кодируемый гомолог DnaJ Plasmodium falciparum взаимодействует с репликацией ori апикопластного генома.Mol Microbiol. 75 (4): 942–56.
35. Сабина Б., Сандра М., Рольф Д. В., Карстен В., Ингрид Б. М. (2010) Сборка кластеров железо-сера (Fe-S) в Plasmodium falciparum. Молекулярная паразитология. Реферат № 256Б:
36. Johnson RA, McFadden GI, Goodman CD (2011) Характеристика двух белков фактора элонгации трансляции органелл малярии: вероятные мишени антималярийной фузидовой кислоты. PLoS One. 6 (6): e20633.
37. Caballero MC, Pedroni MJ, Palmer GH, Suarez CE, Davitt C, et al.(2011) Характеристика белка-носителя ацила и LytB в апикопласте Babesia bovis. Мол Биохим Паразитол. 181 (2): 125–33.
38. Шейнер Л., Демерли Дж. Л., Поулсен Н., Битти В. Л., Лукас О. и др. (2011) Систематический скрининг для обнаружения и анализа белков апикопласта определяет консервативный и важный фактор импорта белка. PLoS Pathog. 7.
39. Geer LY, Domrachev M, Lipman DJ, Bryant SH (2002) CDART: гомология белков по архитектуре домена. Genome Res.12 (10): 1619–23.
40. Aurrecoechea C, Brestelli J, Brunk BP, Fischer S, Gajria B и др. (2010) EuPathDB: портал к базам данных эукариотических патогенов. Nucleic Acids Res. 38 (проблема с базой данных). С. D415–9.

Создайте свою сеть датчиков Интернета вещей — STM32 Blue Pill + nRF24L01 + ESP8266 + Apache Mynewt + thethings.io

Благодаря сетевому IoT наша Узел-сборщик собирает и передает данные датчиков на IoT-сервер в стандартном формате: CoAP JSON .Это гарантирует, что данные наших датчиков могут быть легко обработаны, независимо от сети и используемого сервера . Вот как мы обрабатывать данные датчиков с помощью сервера CoAP, размещенного на thethings.io…

forward_geolocate , geolocate , transform и update_thing являются облачным кодом Триггер и функции, которые мы устанавливаем в thethings.io для обработки данных датчика. Они называют один другой, например, конечный автомат для выполнения геолокации Wi-Fi, преобразования значений датчиков (необработанные температура до расчетной температуры) и обновите состояние объекта…

1️⃣ forward_geolocate это триггер облачного кода, который будет получать любые данные датчиков, передаваемые нашим узлом сборщика через CoAP. Этот триггер позволяет нам перехватывать значения датчиков и преобразовывать их.

2️⃣ forward_geolocate проверяет, содержит ли сообщение какие-либо ssid или rssi (уровень сигнала) поля.

Если бы поля ssid и rssi были найденный, он пересылает сообщение в геолокацию функции облачного кода для обработки.

Это был код из предыдущий учебник, который выполняет геолокацию Wi-Fi с учетом списка SSID Wi-Fi их сигнала Сила. geolocate не нужен, если вы не используете Wi-Fi Функция геолокации.

3️⃣ Если геолокация WiFi включен, функция облачного кода геолокация передает SSID WiFi и информацию об уровне сигнала в API геолокации Google WiFi. Эта информация была полученный при сканировании ESP8266 близлежащих сетей WiFI.

API геолокации оценивает местоположение устройства и возвращает широту, долготу и точность (в метрах).

geolocate вызывает функцию облачного кода update_thing для обновления состояния объекта с результатами геолокации, так что результаты будут сохранены в thethings.io, а информационные панели будут обновлены.

4️⃣ Облачная функция update_thing получает обновленные значения датчиков (широта, долгота, точность) и обновляет их.io вещь состояние, вызвав HTTP API.

Поскольку была указана опция broadcast = true , все информационные панели для этого объекта будут мгновенно обновляться, включая результат геолокации.

5️⃣ Обновление вещи состояние также косвенно запускает forward_geolocate с обновленные значения датчиков. Что приводит к следующему шагу…

6️⃣ Следующий шаг forward_geolocate проверяет, были ли преобразованы значения датчиков (т.е. существует ли преобразованный ключ ).

Если значения не были преобразованный, он вызывает функцию облака преобразовать , чтобы преобразовать ценности.

7️⃣ Функция облачного кода преобразование вычисляет фактическую температуру с плавающей запятой tmp с учетом необработанного температура т .

Он вызывает функцию облачного кода update_thing для обновления состояния объекта вычисленным температура tmp . Преобразованный ключ добавляется к значениям датчика, чтобы указать, что значения датчиков были преобразованы.

Это приводит к этапам 4️⃣ и 5️⃣ что мы видели ранее. Любые панели мониторинга, отображающие tmp значение будет автоматически обновлено.

forward_geolocate срабатывает еще раз, что ведет к финалу шаг…

8️⃣ forward_geolocate принимает геолокационные и преобразованные значения датчиков (широта, долгота, точность, вычисленные температура) и передает их на внешний сервер blue-pill-geolocate.appspot.com через HTTP-запрос POST.

Этот шаг не нужен, если вы не использовать внешний сервер для публичного доступа к данным ваших датчиков.

Подробная информация о внешнем сервере настройку можно найти в gcloud-wifi-geolocation

Обратите внимание, что датчик nRF24L01 Адрес узла (например, B3-B4-B5-B6-F1 ) передается на thethings.io в качестве сенсорного поля , узла . Можно интерпретировать поле узла , чтобы каждый сенсорный узел был представлен разные вещи в вещах.io. В update_thing Функция облачного кода, мы можем сопоставить узел с токеном вещи, используя предопределенная таблица сопоставления.