diff options
Diffstat (limited to 'vendor/voku/stop-words')
38 files changed, 9281 insertions, 0 deletions
diff --git a/vendor/voku/stop-words/CHANGELOG.md b/vendor/voku/stop-words/CHANGELOG.md new file mode 100644 index 000000000..12d4a270b --- /dev/null +++ b/vendor/voku/stop-words/CHANGELOG.md @@ -0,0 +1,25 @@ +# Change log +All notable changes to this project will be documented in this file. +This project adheres to [Semantic Versioning](http://semver.org/). + +## [Unreleased] + +## [2.0.1] - 2018-11-23 +### Fix +- switch czech and catalan stopwords | thx@retep007 + +## [2.0.0] - 2017-11-26 +### Changed +- "php": ">=7.0" + +## [1.2.0] - 2017-05-22 +### Changed +- add more languages + +## [1.1.0] - 2017-05-12 +### Changed +- add more languages + +## [1.0.0] - 2017-05-05 +### Changed +- init diff --git a/vendor/voku/stop-words/LICENSE b/vendor/voku/stop-words/LICENSE new file mode 100644 index 000000000..8fba26e3e --- /dev/null +++ b/vendor/voku/stop-words/LICENSE @@ -0,0 +1,22 @@ +The MIT License (MIT) + +Copyright (c) 2015 Lars Moelleken + +Permission is hereby granted, free of charge, to any person obtaining a copy +of this software and associated documentation files (the "Software"), to deal +in the Software without restriction, including without limitation the rights +to use, copy, modify, merge, publish, distribute, sublicense, and/or sell +copies of the Software, and to permit persons to whom the Software is +furnished to do so, subject to the following conditions: + +The above copyright notice and this permission notice shall be included in all +copies or substantial portions of the Software. + +THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR +IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, +FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE +AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER +LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, +OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE +SOFTWARE. + diff --git a/vendor/voku/stop-words/README.md b/vendor/voku/stop-words/README.md new file mode 100644 index 000000000..66a3bd377 --- /dev/null +++ b/vendor/voku/stop-words/README.md @@ -0,0 +1,73 @@ +[![Build Status](https://travis-ci.org/voku/stop-words.svg?branch=master)](https://travis-ci.org/voku/stop-words) +[![Coverage Status](https://coveralls.io/repos/github/voku/stop-words/badge.svg?branch=master)](https://coveralls.io/github/voku/stop-words?branch=master) +[![Scrutinizer Code Quality](https://scrutinizer-ci.com/g/voku/stop-words/badges/quality-score.png?b=master)](https://scrutinizer-ci.com/g/voku/stop-words/?branch=master) +[![Codacy Badge](https://api.codacy.com/project/badge/Grade/dabeb6d93ead41309e4bbf80c0ec984e)](https://www.codacy.com/app/voku/stop-words?utm_source=github.com&utm_medium=referral&utm_content=voku/stop-words&utm_campaign=Badge_Grade) +[![SensioLabsInsight](https://insight.sensiolabs.com/projects/316837f1-afb0-4ea5-938e-340527eeb4e6/mini.png)](https://insight.sensiolabs.com/projects/316837f1-afb0-4ea5-938e-340527eeb4e6) +[![Latest Stable Version](https://poser.pugx.org/voku/stop-words/v/stable)](https://packagist.org/packages/voku/stop-words) +[![Total Downloads](https://poser.pugx.org/voku/stop-words/downloads)](https://packagist.org/packages/voku/stop-words) +[![Latest Unstable Version](https://poser.pugx.org/voku/stop-words/v/unstable)](https://packagist.org/packages/voku/stop-words) +[![License](https://poser.pugx.org/voku/stop-words/license)](https://packagist.org/packages/voku/stop-words) + +# Stop-Words + +## Description + +A collection of stop words stop words in various languages for e.g. search-functions. + +* [Installation](#installation) +* [Usage](#usage) +* [History](#history) + +## Installation + +1. Install and use [composer](https://getcomposer.org/doc/00-intro.md) in your project. +2. Require this package via composer: + +```sh +composer require voku/stop-words +``` + +## Usage + +```php +$stopWords = new StopWords(); +$stopWords->getStopWordsFromLanguage('de'); +``` + +Available languages +------------------- +* Arabic (ar) +* Bulgarian (bg) +* Catalan (ca) +* Croatian (hr) +* Czech (cz) +* Danish (da) +* Dutch (nl) +* English (en) +* Esperanto (eo) +* Estonian (et) +* Finnish (fi) +* French (fr) +* Georgian (ka) +* German (de) +* Greek (el) +* Hindi (hi) +* Hungarian (hu) +* Indonesian (id) +* Italian (it) +* Latvian (lv) +* Lithuanian (lt) +* Norwegian (no) +* Polish (pl) +* Portuguese (pt) +* Romanian (ro) +* Russian (ru) +* Slovak (sk) +* Spanish (es) +* Swedish (sv) +* Turkish (tr) +* Ukrainian (uk) +* Vietnamese (vi) + +## History +See [CHANGELOG](CHANGELOG.md) for the full history of changes. diff --git a/vendor/voku/stop-words/composer.json b/vendor/voku/stop-words/composer.json new file mode 100644 index 000000000..e62caa578 --- /dev/null +++ b/vendor/voku/stop-words/composer.json @@ -0,0 +1,27 @@ +{ + "name": "voku/stop-words", + "description": "Stop-Words via PHP", + "keywords": [ + "stop-words", + "stop words" + ], + "type": "library", + "license": "MIT", + "authors": [ + { + "name": "Lars Moelleken", + "homepage": "http://www.moelleken.org/" + } + ], + "autoload": { + "psr-4": { + "voku\\": "src/voku/" + } + }, + "require": { + "php": ">=7.0.0" + }, + "require-dev": { + "phpunit/phpunit": "~6.0" + } +} diff --git a/vendor/voku/stop-words/src/voku/helper/StopWords.php b/vendor/voku/stop-words/src/voku/helper/StopWords.php new file mode 100644 index 000000000..8450d9c42 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/StopWords.php @@ -0,0 +1,143 @@ +<?php + +declare(strict_types=1); + +namespace voku\helper; + +/** + * Phonetic-Helper-Class + * + * @package voku\helper + */ +final class StopWords +{ + /** + * @var array + */ + private static $availableLanguages = array( + 'ar', + 'bg', + 'ca', + 'cz', + 'da', + 'de', + 'el', + 'en', + 'eo', + 'es', + 'et', + 'fi', + 'fr', + 'hi', + 'hr', + 'hu', + 'id', + 'it', + 'ka', + 'lt', + 'lv', + 'nl', + 'no', + 'pl', + 'pt', + 'ro', + 'ru', + 'sk', + 'sv', + 'tr', + 'uk', + 'vi' + ); + + /** + * @var array + */ + private $stopWords = array(); + + /** + * Load language-data from one language. + * + * @param string $language + * + * @throws StopWordsLanguageNotExists + */ + private function loadLanguageData(string $language = 'de') + { + if (\in_array($language, self::$availableLanguages, true) === false) { + throw new StopWordsLanguageNotExists('language not supported: ' . $language); + } + + $this->stopWords[$language] = $this->getData($language); + } + + /** + * Get data from "/data/*.php". + * + * @param string $file + * + * @return array <p>Will return an empty array on error.</p> + */ + private function getData(string $file): array + { + static $RESULT_STOP_WORDS_CACHE = array(); + + if (isset($RESULT_STOP_WORDS_CACHE[$file])) { + return $RESULT_STOP_WORDS_CACHE[$file]; + } + + $file = __DIR__ . '/stopwords/' . $file . '.php'; + if (file_exists($file)) { + /** @noinspection PhpIncludeInspection */ + $RESULT_STOP_WORDS_CACHE[$file] = require $file; + } else { + $RESULT_STOP_WORDS_CACHE[$file] = array(); + } + + return $RESULT_STOP_WORDS_CACHE[$file]; + } + + /** + * Get the stop-words from one language. + * + * @param string $language + * + * @return array + * + * @throws StopWordsLanguageNotExists + */ + public function getStopWordsFromLanguage(string $language = 'de'): array + { + if (\in_array($language, self::$availableLanguages, true) === false) { + throw new StopWordsLanguageNotExists('language not supported: ' . $language); + } + + if (!isset($this->stopWords[$language])) { + $this->loadLanguageData($language); + } + + return $this->stopWords[$language]; + } + + private function loadLanguageDataAll() + { + foreach (self::$availableLanguages as $language) { + if (!isset($this->stopWords[$language])) { + $this->loadLanguageData($language); + } + } + } + + /** + * Get all stop-words from all languages. + * + * @return array + * + * @throws StopWordsLanguageNotExists + */ + public function getStopWordsAll(): array + { + $this->loadLanguageDataAll(); + + return $this->stopWords; + } +} diff --git a/vendor/voku/stop-words/src/voku/helper/StopWordsLanguageNotExists.php b/vendor/voku/stop-words/src/voku/helper/StopWordsLanguageNotExists.php new file mode 100644 index 000000000..7c9a6dc5e --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/StopWordsLanguageNotExists.php @@ -0,0 +1,14 @@ +<?php + +declare(strict_types=1); + +namespace voku\helper; + +/** + * PhoneticExceptionLanguageNotExists-Helper-Class + * + * @package voku\helper + */ +class StopWordsLanguageNotExists extends \Exception +{ +} diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/ar.php b/vendor/voku/stop-words/src/voku/helper/stopwords/ar.php new file mode 100644 index 000000000..fd8cd7ff5 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/ar.php @@ -0,0 +1,172 @@ +<?php + +// arabic + +static $data = [ + 'فى', + 'في', + 'كل', + 'لم', + 'لن', + 'له', + 'من', + 'هو', + 'هي', + 'قوة', + 'كما', + 'لها', + 'منذ', + 'وقد', + 'ولا', + 'نفسه', + 'لقاء', + 'مقابل', + 'هناك', + 'وقال', + 'وكان', + 'نهاية', + 'وقالت', + 'وكانت', + 'للامم', + 'فيه', + 'كلم', + 'لكن', + 'وفي', + 'وقف', + 'ولم', + 'ومن', + 'وهو', + 'وهي', + 'يوم', + 'فيها', + 'منها', + 'مليار', + 'لوكالة', + 'يكون', + 'يمكن', + 'مليون', + 'حيث', + 'اكد', + 'الا', + 'اما', + 'امس', + 'السابق', + 'التى', + 'التي', + 'اكثر', + 'ايار', + 'ايضا', + 'ثلاثة', + 'الذاتي', + 'الاخيرة', + 'الثاني', + 'الثانية', + 'الذى', + 'الذي', + 'الان', + 'امام', + 'ايام', + 'خلال', + 'حوالى', + 'الذين', + 'الاول', + 'الاولى', + 'بين', + 'ذلك', + 'دون', + 'حول', + 'حين', + 'الف', + 'الى', + 'انه', + 'اول', + 'ضمن', + 'انها', + 'جميع', + 'الماضي', + 'الوقت', + 'المقبل', + 'اليوم', + 'ـ', + 'ف', + 'و', + 'و6', + 'قد', + 'لا', + 'ما', + 'مع', + 'مساء', + 'هذا', + 'واحد', + 'واضاف', + 'واضافت', + 'فان', + 'قبل', + 'قال', + 'كان', + 'لدى', + 'نحو', + 'هذه', + 'وان', + 'واكد', + 'كانت', + 'واوضح', + 'مايو', + 'ب', + 'ا', + 'أ', + '،', + 'عشر', + 'عدد', + 'عدة', + 'عشرة', + 'عدم', + 'عام', + 'عاما', + 'عن', + 'عند', + 'عندما', + 'على', + 'عليه', + 'عليها', + 'زيارة', + 'سنة', + 'سنوات', + 'تم', + 'ضد', + 'بعد', + 'بعض', + 'اعادة', + 'اعلنت', + 'بسبب', + 'حتى', + 'اذا', + 'احد', + 'اثر', + 'برس', + 'باسم', + 'غدا', + 'شخصا', + 'صباح', + 'اطار', + 'اربعة', + 'اخرى', + 'بان', + 'اجل', + 'غير', + 'بشكل', + 'حاليا', + 'بن', + 'به', + 'ثم', + 'اف', + 'ان', + 'او', + 'اي', + 'بها', + 'صفر', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/bg.php b/vendor/voku/stop-words/src/voku/helper/stopwords/bg.php new file mode 100644 index 000000000..9bdb95353 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/bg.php @@ -0,0 +1,269 @@ +<?php + +// bulgarian + +static $data = [ + 'а', + 'автентичен', + 'аз', + 'ако', + 'ала', + 'бе', + 'без', + 'беше', + 'би', + 'бивш', + 'бивша', + 'бившо', + 'бил', + 'била', + 'били', + 'било', + 'благодаря', + 'близо', + 'бъдат', + 'бъде', + 'бяха', + 'в', + 'вас', + 'ваш', + 'ваша', + 'вероятно', + 'вече', + 'взема', + 'ви', + 'вие', + 'винаги', + 'внимава', + 'време', + 'все', + 'всеки', + 'всички', + 'всичко', + 'всяка', + 'във', + 'въпреки', + 'върху', + 'г', + 'ги', + 'главен', + 'главна', + 'главно', + 'глас', + 'го', + 'година', + 'години', + 'годишен', + 'д', + 'да', + 'дали', + 'два', + 'двама', + 'двамата', + 'две', + 'двете', + 'ден', + 'днес', + 'дни', + 'до', + 'добра', + 'добре', + 'добро', + 'добър', + 'докато', + 'докога', + 'дори', + 'досега', + 'доста', + 'друг', + 'друга', + 'други', + 'е', + 'евтин', + 'едва', + 'един', + 'една', + 'еднаква', + 'еднакви', + 'еднакъв', + 'едно', + 'екип', + 'ето', + 'живот', + 'за', + 'забавям', + 'зад', + 'заедно', + 'заради', + 'засега', + 'заспал', + 'затова', + 'защо', + 'защото', + 'и', + 'из', + 'или', + 'им', + 'има', + 'имат', + 'иска', + 'й', + 'каза', + 'как', + 'каква', + 'какво', + 'както', + 'какъв', + 'като', + 'кога', + 'когато', + 'което', + 'които', + 'кой', + 'който', + 'колко', + 'която', + 'къде', + 'където', + 'към', + 'лесен', + 'лесно', + 'ли', + 'лош', + 'м', + 'май', + 'малко', + 'ме', + 'между', + 'мек', + 'мен', + 'месец', + 'ми', + 'много', + 'мнозина', + 'мога', + 'могат', + 'може', + 'мокър', + 'моля', + 'момента', + 'му', + 'н', + 'на', + 'над', + 'назад', + 'най', + 'направи', + 'напред', + 'например', + 'нас', + 'не', + 'него', + 'нещо', + 'нея', + 'ни', + 'ние', + 'никой', + 'нито', + 'нищо', + 'но', + 'нов', + 'нова', + 'нови', + 'новина', + 'някои', + 'някой', + 'няколко', + 'няма', + 'обаче', + 'около', + 'освен', + 'особено', + 'от', + 'отгоре', + 'отново', + 'още', + 'пак', + 'по', + 'повече', + 'повечето', + 'под', + 'поне', + 'поради', + 'после', + 'почти', + 'прави', + 'пред', + 'преди', + 'през', + 'при', + 'пък', + 'първата', + 'първи', + 'първо', + 'пъти', + 'равен', + 'равна', + 'с', + 'са', + 'сам', + 'само', + 'се', + 'сега', + 'си', + 'син', + 'скоро', + 'след', + 'следващ', + 'сме', + 'смях', + 'според', + 'сред', + 'срещу', + 'сте', + 'съм', + 'със', + 'също', + 'т', + 'тази', + 'така', + 'такива', + 'такъв', + 'там', + 'твой', + 'те', + 'тези', + 'ти', + 'т.н.', + 'то', + 'това', + 'тогава', + 'този', + 'той', + 'толкова', + 'точно', + 'три', + 'трябва', + 'тук', + 'тъй', + 'тя', + 'тях', + 'у', + 'утре', + 'харесва', + 'хиляди', + 'ч', + 'часа', + 'че', + 'често', + 'чрез', + 'ще', + 'щом', + 'юмрук', + 'я', + 'як', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/ca.php b/vendor/voku/stop-words/src/voku/helper/stopwords/ca.php new file mode 100644 index 000000000..8c461ec49 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/ca.php @@ -0,0 +1,104 @@ +<?php + +// catalan + +static $data = [ + 'og', + 'i', + 'jeg', + 'det', + 'at', + 'en', + 'den', + 'til', + 'er', + 'som', + 'på', + 'de', + 'med', + 'han', + 'af', + 'for', + 'ikke', + 'der', + 'var', + 'mig', + 'sig', + 'men', + 'et', + 'har', + 'om', + 'vi', + 'min', + 'havde', + 'ham', + 'hun', + 'nu', + 'over', + 'da', + 'fra', + 'du', + 'ud', + 'sin', + 'dem', + 'os', + 'op', + 'man', + 'hans', + 'hvor', + 'eller', + 'hvad', + 'skal', + 'selv', + 'her', + 'alle', + 'vil', + 'blev', + 'kunne', + 'ind', + 'når', + 'være', + 'dog', + 'noget', + 'ville', + 'jo', + 'deres', + 'efter', + 'ned', + 'skulle', + 'denne', + 'end', + 'dette', + 'mit', + 'også', + 'under', + 'have', + 'dig', + 'anden', + 'hende', + 'mine', + 'alt', + 'meget', + 'sit', + 'sine', + 'vor', + 'mod', + 'disse', + 'hvis', + 'din', + 'nogle', + 'hos', + 'blive', + 'mange', + 'ad', + 'bliver', + 'hendes', + 'været', + 'thi', + 'jer', + 'sådan', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/cz.php b/vendor/voku/stop-words/src/voku/helper/stopwords/cz.php new file mode 100644 index 000000000..932de81b6 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/cz.php @@ -0,0 +1,266 @@ +<?php + +// czech + +static $data = [ + 'ačkoli', + 'ahoj', + 'ale', + 'anebo', + 'ano', + 'asi', + 'aspoň', + 'během', + 'bez', + 'beze', + 'blízko', + 'bohužel', + 'brzo', + 'bude', + 'budeme', + 'budeš', + 'budete', + 'budou', + 'budu', + 'byl', + 'byla', + 'byli', + 'bylo', + 'byly', + 'bys', + 'čau', + 'chce', + 'chceme', + 'chceš', + 'chcete', + 'chci', + 'chtějí', + 'chtít', + 'chut\'', + 'chuti', + 'co', + 'čtrnáct', + 'čtyři', + 'dál', + 'dále', + 'daleko', + 'děkovat', + 'děkujeme', + 'děkuji', + 'den', + 'deset', + 'devatenáct', + 'devět', + 'do', + 'dobrý', + 'docela', + 'dva', + 'dvacet', + 'dvanáct', + 'dvě', + 'hodně', + 'já', + 'jak', + 'jde', + 'je', + 'jeden', + 'jedenáct', + 'jedna', + 'jedno', + 'jednou', + 'jedou', + 'jeho', + 'její', + 'jejich', + 'jemu', + 'jen', + 'jenom', + 'ještě', + 'jestli', + 'jestliže', + 'jí', + 'jich', + 'jím', + 'jimi', + 'jinak', + 'jsem', + 'jsi', + 'jsme', + 'jsou', + 'jste', + 'kam', + 'kde', + 'kdo', + 'kdy', + 'když', + 'ke', + 'kolik', + 'kromě', + 'která', + 'které', + 'kteří', + 'který', + 'kvůli', + 'má', + 'mají', + 'málo', + 'mám', + 'máme', + 'máš', + 'máte', + 'mé', + 'mě', + 'mezi', + 'mí', + 'mít', + 'mně', + 'mnou', + 'moc', + 'mohl', + 'mohou', + 'moje', + 'moji', + 'možná', + 'můj', + 'musí', + 'může', + 'my', + 'na', + 'nad', + 'nade', + 'nám', + 'námi', + 'naproti', + 'nás', + 'náš', + 'naše', + 'naši', + 'ne', + 'ně', + 'nebo', + 'nebyl', + 'nebyla', + 'nebyli', + 'nebyly', + 'něco', + 'nedělá', + 'nedělají', + 'nedělám', + 'neděláme', + 'neděláš', + 'neděláte', + 'nějak', + 'nejsi', + 'někde', + 'někdo', + 'nemají', + 'nemáme', + 'nemáte', + 'neměl', + 'němu', + 'není', + 'nestačí', + 'nevadí', + 'než', + 'nic', + 'nich', + 'ním', + 'nimi', + 'nula', + 'od', + 'ode', + 'on', + 'ona', + 'oni', + 'ono', + 'ony', + 'osm', + 'osmnáct', + 'pak', + 'patnáct', + 'pět', + 'po', + 'pořád', + 'potom', + 'pozdě', + 'před', + 'přes', + 'přese', + 'pro', + 'proč', + 'prosím', + 'prostě', + 'proti', + 'protože', + 'rovně', + 'se', + 'sedm', + 'sedmnáct', + 'šest', + 'šestnáct', + 'skoro', + 'smějí', + 'smí', + 'snad', + 'spolu', + 'sta', + 'sté', + 'sto', + 'ta', + 'tady', + 'tak', + 'takhle', + 'taky', + 'tam', + 'tamhle', + 'tamhleto', + 'tamto', + 'tě', + 'tebe', + 'tebou', + 'ted\'', + 'tedy', + 'ten', + 'ti', + 'tisíc', + 'tisíce', + 'to', + 'tobě', + 'tohle', + 'toto', + 'třeba', + 'tři', + 'třináct', + 'trošku', + 'tvá', + 'tvé', + 'tvoje', + 'tvůj', + 'ty', + 'určitě', + 'už', + 'vám', + 'vámi', + 'vás', + 'váš', + 'vaše', + 'vaši', + 've', + 'večer', + 'vedle', + 'vlastně', + 'všechno', + 'všichni', + 'vůbec', + 'vy', + 'vždy', + 'za', + 'zač', + 'zatímco', + 'ze', + 'že', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/da.php b/vendor/voku/stop-words/src/voku/helper/stopwords/da.php new file mode 100644 index 000000000..14614b63a --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/da.php @@ -0,0 +1,180 @@ +<?php + +// danish + +static $data = [ + 'ad', + 'af', + 'aldrig', + 'alle', + 'alt', + 'anden', + 'andet', + 'andre', + 'at', + 'bare', + 'begge', + 'blev', + 'blive', + 'bliver', + 'da', + 'de', + 'dem', + 'den', + 'denne', + 'der', + 'deres', + 'det', + 'dette', + 'dig', + 'din', + 'dine', + 'disse', + 'dit', + 'dog', + 'du', + 'efter', + 'ej', + 'eller', + 'en', + 'end', + 'ene', + 'eneste', + 'enhver', + 'er', + 'et', + 'far', + 'fem', + 'fik', + 'fire', + 'flere', + 'fleste', + 'for', + 'fordi', + 'forrige', + 'fra', + 'få', + 'får', + 'før', + 'god', + 'godt', + 'ham', + 'han', + 'hans', + 'har', + 'havde', + 'have', + 'hej', + 'helt', + 'hende', + 'hendes', + 'her', + 'hos', + 'hun', + 'hvad', + 'hvem', + 'hver', + 'hvilken', + 'hvis', + 'hvor', + 'hvordan', + 'hvorfor', + 'hvornår', + 'i', + 'ikke', + 'ind', + 'ingen', + 'intet', + 'ja', + 'jeg', + 'jer', + 'jeres', + 'jo', + 'kan', + 'kom', + 'komme', + 'kommer', + 'kun', + 'kunne', + 'lad', + 'lav', + 'lidt', + 'lige', + 'lille', + 'man', + 'mand', + 'mange', + 'med', + 'meget', + 'men', + 'mens', + 'mere', + 'mig', + 'min', + 'mine', + 'mit', + 'mod', + 'må', + 'ned', + 'nej', + 'ni', + 'nogen', + 'noget', + 'nogle', + 'nu', + 'ny', + 'nyt', + 'når', + 'nær', + 'næste', + 'næsten', + 'og', + 'også', + 'okay', + 'om', + 'op', + 'os', + 'otte', + 'over', + 'på', + 'se', + 'seks', + 'selv', + 'ser', + 'ses', + 'sig', + 'sige', + 'sin', + 'sine', + 'sit', + 'skal', + 'skulle', + 'som', + 'stor', + 'store', + 'syv', + 'så', + 'sådan', + 'tag', + 'tage', + 'thi', + 'ti', + 'til', + 'to', + 'tre', + 'ud', + 'under', + 'var', + 'ved', + 'vi', + 'vil', + 'ville', + 'vor', + 'vores', + 'være', + 'været', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/de.php b/vendor/voku/stop-words/src/voku/helper/stopwords/de.php new file mode 100644 index 000000000..06ffb94ad --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/de.php @@ -0,0 +1,1033 @@ +<?php + +// german + +static $data = [ + 'ab', + 'bei', + 'da', + 'deshalb', + 'ein', + 'für', + 'haben', + 'hier', + 'ich', + 'ja', + 'kann', + 'machen', + 'muesste', + 'nach', + 'oder', + 'seid', + 'sonst', + 'und', + 'vom', + 'wann', + 'wenn', + 'wie', + 'zu', + 'bin', + 'eines', + 'hat', + 'manche', + 'solches', + 'an', + 'anderm', + 'bis', + 'das', + 'deinem', + 'demselben', + 'dir', + 'doch', + 'einig', + 'er', + 'eurer', + 'hatte', + 'ihnen', + 'ihre', + 'ins', + 'jenen', + 'keinen', + 'manchem', + 'meinen', + 'nichts', + 'seine', + 'soll', + 'unserm', + 'welche', + 'werden', + 'wollte', + 'während', + 'alle', + 'allem', + 'allen', + 'aller', + 'alles', + 'als', + 'also', + 'am', + 'ander', + 'andere', + 'anderem', + 'anderen', + 'anderer', + 'anderes', + 'andern', + 'anderr', + 'anders', + 'auch', + 'auf', + 'aus', + 'bist', + 'bsp.', + 'daher', + 'damit', + 'dann', + 'dasselbe', + 'dazu', + 'daß', + 'dein', + 'deine', + 'deinen', + 'deiner', + 'deines', + 'dem', + 'den', + 'denn', + 'denselben', + 'der', + 'derer', + 'derselbe', + 'derselben', + 'des', + 'desselben', + 'dessen', + 'dich', + 'die', + 'dies', + 'diese', + 'dieselbe', + 'dieselben', + 'diesem', + 'diesen', + 'dieser', + 'dieses', + 'dort', + 'du', + 'durch', + 'eine', + 'einem', + 'einen', + 'einer', + 'einige', + 'einigem', + 'einigen', + 'einiger', + 'einiges', + 'einmal', + 'es', + 'etwas', + 'euch', + 'euer', + 'eure', + 'eurem', + 'euren', + 'eures', + 'ganz', + 'ganze', + 'ganzen', + 'ganzer', + 'ganzes', + 'gegen', + 'gemacht', + 'gesagt', + 'gesehen', + 'gewesen', + 'gewollt', + 'hab', + 'habe', + 'hatten', + 'hin', + 'hinter', + 'ihm', + 'ihn', + 'ihr', + 'ihrem', + 'ihren', + 'ihrer', + 'ihres', + 'im', + 'in', + 'indem', + 'ist', + 'jede', + 'jedem', + 'jeden', + 'jeder', + 'jedes', + 'jene', + 'jenem', + 'jener', + 'jenes', + 'jetzt', + 'kein', + 'keine', + 'keinem', + 'keiner', + 'keines', + 'konnte', + 'können', + 'könnte', + 'mache', + 'machst', + 'macht', + 'machte', + 'machten', + 'man', + 'manchen', + 'mancher', + 'manches', + 'mein', + 'meine', + 'meinem', + 'meiner', + 'meines', + 'mich', + 'mir', + 'mit', + 'muss', + 'musste', + 'müßt', + 'nicht', + 'noch', + 'nun', + 'nur', + 'ob', + 'ohne', + 'sage', + 'sagen', + 'sagt', + 'sagte', + 'sagten', + 'sagtest', + 'sehe', + 'sehen', + 'sehr', + 'seht', + 'sein', + 'seinem', + 'seinen', + 'seiner', + 'seines', + 'selbst', + 'sich', + 'sicher', + 'sie', + 'sind', + 'so', + 'solche', + 'solchem', + 'solchen', + 'solcher', + 'sollte', + 'sondern', + 'um', + 'uns', + 'unse', + 'unsen', + 'unser', + 'unses', + 'unter', + 'viel', + 'von', + 'vor', + 'war', + 'waren', + 'warst', + 'was', + 'weg', + 'weil', + 'weiter', + 'welchem', + 'welchen', + 'welcher', + 'welches', + 'werde', + 'wieder', + 'will', + 'wir', + 'wird', + 'wirst', + 'wo', + 'wolle', + 'wollen', + 'wollt', + 'wollten', + 'wolltest', + 'wolltet', + 'würde', + 'würden', + 'z.B.', + 'zum', + 'zur', + 'zwar', + 'zwischen', + 'über', + 'aber', + 'abgerufen', + 'abgerufene', + 'abgerufener', + 'abgerufenes', + 'acht', + 'acute', + 'allein', + 'allerdings', + 'allerlei', + 'allg', + 'allgemein', + 'allmählich', + 'allzu', + 'alsbald', + 'amp', + 'and', + 'andererseits', + 'andernfalls', + 'anerkannt', + 'anerkannte', + 'anerkannter', + 'anerkanntes', + 'anfangen', + 'anfing', + 'angefangen', + 'angesetze', + 'angesetzt', + 'angesetzten', + 'angesetzter', + 'ansetzen', + 'anstatt', + 'arbeiten', + 'aufgehört', + 'aufgrund', + 'aufhören', + 'aufhörte', + 'aufzusuchen', + 'ausdrücken', + 'ausdrückt', + 'ausdrückte', + 'ausgenommen', + 'ausser', + 'ausserdem', + 'author', + 'autor', + 'außen', + 'außer', + 'außerdem', + 'außerhalb', + 'background', + 'bald', + 'bearbeite', + 'bearbeiten', + 'bearbeitete', + 'bearbeiteten', + 'bedarf', + 'bedurfte', + 'bedürfen', + 'been', + 'befragen', + 'befragte', + 'befragten', + 'befragter', + 'begann', + 'beginnen', + 'begonnen', + 'behalten', + 'behielt', + 'beide', + 'beiden', + 'beiderlei', + 'beides', + 'beim', + 'beinahe', + 'beitragen', + 'beitrugen', + 'bekannt', + 'bekannte', + 'bekannter', + 'bekennen', + 'benutzt', + 'bereits', + 'berichten', + 'berichtet', + 'berichtete', + 'berichteten', + 'besonders', + 'besser', + 'bestehen', + 'besteht', + 'beträchtlich', + 'bevor', + 'bezüglich', + 'bietet', + 'bisher', + 'bislang', + 'biz', + 'bleiben', + 'blieb', + 'bloss', + 'bloß', + 'border', + 'brachte', + 'brachten', + 'brauchen', + 'braucht', + 'bringen', + 'bräuchte', + 'bzw', + 'böden', + 'ca', + 'ca.', + 'collapsed', + 'com', + 'comment', + 'content', + 'da?', + 'dabei', + 'dadurch', + 'dafür', + 'dagegen', + 'dahin', + 'damals', + 'danach', + 'daneben', + 'dank', + 'danke', + 'danken', + 'dannen', + 'daran', + 'darauf', + 'daraus', + 'darf', + 'darfst', + 'darin', + 'darum', + 'darunter', + 'darüber', + 'darüberhinaus', + 'dass', + 'davon', + 'davor', + 'demnach', + 'denen', + 'dennoch', + 'derart', + 'derartig', + 'derem', + 'deren', + 'derjenige', + 'derjenigen', + 'derzeit', + 'desto', + 'deswegen', + 'diejenige', + 'diesseits', + 'dinge', + 'direkt', + 'direkte', + 'direkten', + 'direkter', + 'doc', + 'doppelt', + 'dorther', + 'dorthin', + 'drauf', + 'drei', + 'dreißig', + 'drin', + 'dritte', + 'drunter', + 'drüber', + 'dunklen', + 'durchaus', + 'durfte', + 'durften', + 'dürfen', + 'dürfte', + 'eben', + 'ebenfalls', + 'ebenso', + 'ehe', + 'eher', + 'eigenen', + 'eigenes', + 'eigentlich', + 'einbaün', + 'einerseits', + 'einfach', + 'einführen', + 'einführte', + 'einführten', + 'eingesetzt', + 'einigermaßen', + 'eins', + 'einseitig', + 'einseitige', + 'einseitigen', + 'einseitiger', + 'einst', + 'einstmals', + 'einzig', + 'elf', + 'ende', + 'entsprechend', + 'entweder', + 'ergänze', + 'ergänzen', + 'ergänzte', + 'ergänzten', + 'erhalten', + 'erhielt', + 'erhielten', + 'erhält', + 'erneut', + 'erst', + 'erste', + 'ersten', + 'erster', + 'eröffne', + 'eröffnen', + 'eröffnet', + 'eröffnete', + 'eröffnetes', + 'etc', + 'etliche', + 'etwa', + 'fall', + 'falls', + 'fand', + 'fast', + 'ferner', + 'finden', + 'findest', + 'findet', + 'folgende', + 'folgenden', + 'folgender', + 'folgendes', + 'folglich', + 'for', + 'fordern', + 'fordert', + 'forderte', + 'forderten', + 'fortsetzen', + 'fortsetzt', + 'fortsetzte', + 'fortsetzten', + 'fragte', + 'frau', + 'frei', + 'freie', + 'freier', + 'freies', + 'fuer', + 'fünf', + 'gab', + 'ganzem', + 'gar', + 'gbr', + 'geb', + 'geben', + 'geblieben', + 'gebracht', + 'gedurft', + 'geehrt', + 'geehrte', + 'geehrten', + 'geehrter', + 'gefallen', + 'gefiel', + 'gefälligst', + 'gefällt', + 'gegeben', + 'gehabt', + 'gehen', + 'geht', + 'gekommen', + 'gekonnt', + 'gemocht', + 'gemäss', + 'genommen', + 'genug', + 'gern', + 'gestern', + 'gestrige', + 'getan', + 'geteilt', + 'geteilte', + 'getragen', + 'gewissermaßen', + 'geworden', + 'ggf', + 'gib', + 'gibt', + 'gleich', + 'gleichwohl', + 'gleichzeitig', + 'glücklicherweise', + 'gmbh', + 'gratulieren', + 'gratuliert', + 'gratulierte', + 'gute', + 'guten', + 'gängig', + 'gängige', + 'gängigen', + 'gängiger', + 'gängiges', + 'gänzlich', + 'haette', + 'halb', + 'hallo', + 'hast', + 'hattest', + 'hattet', + 'heraus', + 'herein', + 'heute', + 'heutige', + 'hiermit', + 'hiesige', + 'hinein', + 'hinten', + 'hinterher', + 'hoch', + 'html', + 'http', + 'hundert', + 'hätt', + 'hätte', + 'hätten', + 'höchstens', + 'igitt', + 'image', + 'immer', + 'immerhin', + 'important', + 'indessen', + 'info', + 'infolge', + 'innen', + 'innerhalb', + 'insofern', + 'inzwischen', + 'irgend', + 'irgendeine', + 'irgendwas', + 'irgendwen', + 'irgendwer', + 'irgendwie', + 'irgendwo', + 'je', + 'jed', + 'jedenfalls', + 'jederlei', + 'jedoch', + 'jemand', + 'jenseits', + 'jährig', + 'jährige', + 'jährigen', + 'jähriges', + 'kam', + 'kannst', + 'kaum', + 'kei nes', + 'keinerlei', + 'keineswegs', + 'klar', + 'klare', + 'klaren', + 'klares', + 'klein', + 'kleinen', + 'kleiner', + 'kleines', + 'koennen', + 'koennt', + 'koennte', + 'koennten', + 'komme', + 'kommen', + 'kommt', + 'konkret', + 'konkrete', + 'konkreten', + 'konkreter', + 'konkretes', + 'konnten', + 'könn', + 'könnt', + 'könnten', + 'künftig', + 'lag', + 'lagen', + 'langsam', + 'lassen', + 'laut', + 'lediglich', + 'leer', + 'legen', + 'legte', + 'legten', + 'leicht', + 'leider', + 'lesen', + 'letze', + 'letzten', + 'letztendlich', + 'letztens', + 'letztes', + 'letztlich', + 'lichten', + 'liegt', + 'liest', + 'links', + 'längst', + 'längstens', + 'mag', + 'magst', + 'mal', + 'mancherorts', + 'manchmal', + 'mann', + 'margin', + 'med', + 'mehr', + 'mehrere', + 'meist', + 'meiste', + 'meisten', + 'meta', + 'mindestens', + 'mithin', + 'mochte', + 'morgen', + 'morgige', + 'muessen', + 'muesst', + 'musst', + 'mussten', + 'muß', + 'mußt', + 'möchte', + 'möchten', + 'möchtest', + 'mögen', + 'möglich', + 'mögliche', + 'möglichen', + 'möglicher', + 'möglicherweise', + 'müssen', + 'müsste', + 'müssten', + 'müßte', + 'nachdem', + 'nacher', + 'nachhinein', + 'nahm', + 'natürlich', + 'ncht', + 'neben', + 'nebenan', + 'nehmen', + 'nein', + 'neu', + 'neue', + 'neuem', + 'neuen', + 'neuer', + 'neues', + 'neun', + 'nie', + 'niemals', + 'niemand', + 'nimm', + 'nimmer', + 'nimmt', + 'nirgends', + 'nirgendwo', + 'nter', + 'nutzen', + 'nutzt', + 'nutzung', + 'nächste', + 'nämlich', + 'nötigenfalls', + 'nützt', + 'oben', + 'oberhalb', + 'obgleich', + 'obschon', + 'obwohl', + 'oft', + 'online', + 'org', + 'padding', + 'per', + 'pfui', + 'plötzlich', + 'pro', + 'reagiere', + 'reagieren', + 'reagiert', + 'reagierte', + 'rechts', + 'regelmäßig', + 'rief', + 'rund', + 'sang', + 'sangen', + 'schlechter', + 'schließlich', + 'schnell', + 'schon', + 'schreibe', + 'schreiben', + 'schreibens', + 'schreiber', + 'schwierig', + 'schätzen', + 'schätzt', + 'schätzte', + 'schätzten', + 'sechs', + 'sect', + 'sehrwohl', + 'sei', + 'seit', + 'seitdem', + 'seite', + 'seiten', + 'seither', + 'selber', + 'senke', + 'senken', + 'senkt', + 'senkte', + 'senkten', + 'setzen', + 'setzt', + 'setzte', + 'setzten', + 'sicherlich', + 'sieben', + 'siebte', + 'siehe', + 'sieht', + 'singen', + 'singt', + 'sobald', + 'sodaß', + 'soeben', + 'sofern', + 'sofort', + 'sog', + 'sogar', + 'solange', + 'solc hen', + 'solch', + 'sollen', + 'sollst', + 'sollt', + 'sollten', + 'solltest', + 'somit', + 'sonstwo', + 'sooft', + 'soviel', + 'soweit', + 'sowie', + 'sowohl', + 'spielen', + 'später', + 'startet', + 'startete', + 'starteten', + 'statt', + 'stattdessen', + 'steht', + 'steige', + 'steigen', + 'steigt', + 'stets', + 'stieg', + 'stiegen', + 'such', + 'suchen', + 'sämtliche', + 'tages', + 'tat', + 'tatsächlich', + 'tatsächlichen', + 'tatsächlicher', + 'tatsächliches', + 'tausend', + 'teile', + 'teilen', + 'teilte', + 'teilten', + 'titel', + 'total', + 'trage', + 'tragen', + 'trotzdem', + 'trug', + 'trägt', + 'tun', + 'tust', + 'tut', + 'txt', + 'tät', + 'ueber', + 'umso', + 'unbedingt', + 'ungefähr', + 'unmöglich', + 'unmögliche', + 'unmöglichen', + 'unmöglicher', + 'unnötig', + 'unsem', + 'unser', + 'unsere', + 'unserem', + 'unseren', + 'unserer', + 'unseres', + 'unten', + 'unterbrach', + 'unterbrechen', + 'unterhalb', + 'unwichtig', + 'usw', + 'var', + 'vergangen', + 'vergangene', + 'vergangener', + 'vergangenes', + 'vermag', + 'vermutlich', + 'vermögen', + 'verrate', + 'verraten', + 'verriet', + 'verrieten', + 'version', + 'versorge', + 'versorgen', + 'versorgt', + 'versorgte', + 'versorgten', + 'versorgtes', + 'veröffentlichen', + 'veröffentlicher', + 'veröffentlicht', + 'veröffentlichte', + 'veröffentlichten', + 'veröffentlichtes', + 'viele', + 'vielen', + 'vieler', + 'vieles', + 'vielleicht', + 'vielmals', + 'vier', + 'vollständig', + 'voran', + 'vorbei', + 'vorgestern', + 'vorher', + 'vorne', + 'vorüber', + 'völlig', + 'während', + 'wachen', + 'waere', + 'warum', + 'weder', + 'wegen', + 'weitere', + 'weiterem', + 'weiteren', + 'weiterer', + 'weiteres', + 'weiterhin', + 'weiß', + 'wem', + 'wen', + 'wenig', + 'wenige', + 'weniger', + 'wenigstens', + 'wenngleich', + 'wer', + 'werdet', + 'weshalb', + 'wessen', + 'wichtig', + 'wieso', + 'wieviel', + 'wiewohl', + 'willst', + 'wirklich', + 'wodurch', + 'wogegen', + 'woher', + 'wohin', + 'wohingegen', + 'wohl', + 'wohlweislich', + 'womit', + 'woraufhin', + 'woraus', + 'worin', + 'wurde', + 'wurden', + 'währenddessen', + 'wär', + 'wäre', + 'wären', + 'zahlreich', + 'zehn', + 'zeitweise', + 'ziehen', + 'zieht', + 'zog', + 'zogen', + 'zudem', + 'zuerst', + 'zufolge', + 'zugleich', + 'zuletzt', + 'zumal', + 'zurück', + 'zusammen', + 'zuviel', + 'zwanzig', + 'zwei', + 'zwölf', + 'ähnlich', + 'übel', + 'überall', + 'überallhin', + 'überdies', + 'übermorgen', + 'übrig', + 'übrigens', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/el.php b/vendor/voku/stop-words/src/voku/helper/stopwords/el.php new file mode 100644 index 000000000..5752a6e78 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/el.php @@ -0,0 +1,275 @@ +<?php + +// greek + +static $data = [ + 'αλλα', + 'αν', + 'αντι', + 'απο', + 'αυτα', + 'αυτεσ', + 'αυτη', + 'αυτο', + 'αυτοι', + 'αυτοσ', + 'αυτουσ', + 'αυτων', + 'αἱ', + 'αἳ', + 'αἵ', + 'αὐτόσ', + 'αὐτὸς', + 'αὖ', + 'γάρ', + 'γα', + 'γα^', + 'γε', + 'για', + 'γοῦν', + 'γὰρ', + 'δ\'', + 'δέ', + 'δή', + 'δαί', + 'δαίσ', + 'δαὶ', + 'δαὶς', + 'δε', + 'δεν', + 'δι\'', + 'διά', + 'διὰ', + 'δὲ', + 'δὴ', + 'δ’', + 'εαν', + 'ειμαι', + 'ειμαστε', + 'ειναι', + 'εισαι', + 'ειστε', + 'εκεινα', + 'εκεινεσ', + 'εκεινη', + 'εκεινο', + 'εκεινοι', + 'εκεινοσ', + 'εκεινουσ', + 'εκεινων', + 'ενω', + 'επ', + 'επι', + 'εἰ', + 'εἰμί', + 'εἰμὶ', + 'εἰς', + 'εἰσ', + 'εἴ', + 'εἴμι', + 'εἴτε', + 'η', + 'θα', + 'ισωσ', + 'κ', + 'καί', + 'καίτοι', + 'καθ', + 'και', + 'κατ', + 'κατά', + 'κατα', + 'κατὰ', + 'καὶ', + 'κι', + 'κἀν', + 'κἂν', + 'μέν', + 'μή', + 'μήτε', + 'μα', + 'με', + 'μεθ', + 'μετ', + 'μετά', + 'μετα', + 'μετὰ', + 'μη', + 'μην', + 'μἐν', + 'μὲν', + 'μὴ', + 'μὴν', + 'να', + 'ο', + 'οι', + 'ομωσ', + 'οπωσ', + 'οσο', + 'οτι', + 'οἱ', + 'οἳ', + 'οἷς', + 'οὐ', + 'οὐδ', + 'οὐδέ', + 'οὐδείσ', + 'οὐδεὶς', + 'οὐδὲ', + 'οὐδὲν', + 'οὐκ', + 'οὐχ', + 'οὐχὶ', + 'οὓς', + 'οὔτε', + 'οὕτω', + 'οὕτως', + 'οὕτωσ', + 'οὖν', + 'οὗ', + 'οὗτος', + 'οὗτοσ', + 'παρ', + 'παρά', + 'παρα', + 'παρὰ', + 'περί', + 'περὶ', + 'ποια', + 'ποιεσ', + 'ποιο', + 'ποιοι', + 'ποιοσ', + 'ποιουσ', + 'ποιων', + 'ποτε', + 'που', + 'ποῦ', + 'προ', + 'προσ', + 'πρόσ', + 'πρὸ', + 'πρὸς', + 'πως', + 'πωσ', + 'σε', + 'στη', + 'στην', + 'στο', + 'στον', + 'σόσ', + 'σύ', + 'σύν', + 'σὸς', + 'σὺ', + 'σὺν', + 'τά', + 'τήν', + 'τί', + 'τίς', + 'τίσ', + 'τα', + 'ταῖς', + 'τε', + 'την', + 'τησ', + 'τι', + 'τινα', + 'τις', + 'τισ', + 'το', + 'τοί', + 'τοι', + 'τοιοῦτος', + 'τοιοῦτοσ', + 'τον', + 'τοτε', + 'του', + 'τούσ', + 'τοὺς', + 'τοῖς', + 'τοῦ', + 'των', + 'τό', + 'τόν', + 'τότε', + 'τὰ', + 'τὰς', + 'τὴν', + 'τὸ', + 'τὸν', + 'τῆς', + 'τῆσ', + 'τῇ', + 'τῶν', + 'τῷ', + 'ωσ', + 'ἀλλ\'', + 'ἀλλά', + 'ἀλλὰ', + 'ἀλλ’', + 'ἀπ', + 'ἀπό', + 'ἀπὸ', + 'ἀφ', + 'ἂν', + 'ἃ', + 'ἄλλος', + 'ἄλλοσ', + 'ἄν', + 'ἄρα', + 'ἅμα', + 'ἐάν', + 'ἐγώ', + 'ἐγὼ', + 'ἐκ', + 'ἐμόσ', + 'ἐμὸς', + 'ἐν', + 'ἐξ', + 'ἐπί', + 'ἐπεὶ', + 'ἐπὶ', + 'ἐστι', + 'ἐφ', + 'ἐὰν', + 'ἑαυτοῦ', + 'ἔτι', + 'ἡ', + 'ἢ', + 'ἣ', + 'ἤ', + 'ἥ', + 'ἧς', + 'ἵνα', + 'ὁ', + 'ὃ', + 'ὃν', + 'ὃς', + 'ὅ', + 'ὅδε', + 'ὅθεν', + 'ὅπερ', + 'ὅς', + 'ὅσ', + 'ὅστις', + 'ὅστισ', + 'ὅτε', + 'ὅτι', + 'ὑμόσ', + 'ὑπ', + 'ὑπέρ', + 'ὑπό', + 'ὑπὲρ', + 'ὑπὸ', + 'ὡς', + 'ὡσ', + 'ὥς', + 'ὥστε', + 'ὦ', + 'ᾧ', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/en.php b/vendor/voku/stop-words/src/voku/helper/stopwords/en.php new file mode 100644 index 000000000..b906ad3ef --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/en.php @@ -0,0 +1,329 @@ +<?php + +// english + +static $data = [ + 'a', + 'about', + 'above', + 'above', + 'across', + 'after', + 'afterwards', + 'again', + 'against', + 'all', + 'almost', + 'alone', + 'along', + 'already', + 'also', + 'although', + 'always', + 'am', + 'among', + 'amongst', + 'amoungst', + 'amount', + 'an', + 'and', + 'another', + 'any', + 'anyhow', + 'anyone', + 'anything', + 'anyway', + 'anywhere', + 'are', + 'around', + 'as', + 'at', + 'back', + 'be', + 'became', + 'because', + 'become', + 'becomes', + 'becoming', + 'been', + 'before', + 'beforehand', + 'behind', + 'being', + 'below', + 'beside', + 'besides', + 'between', + 'beyond', + 'bill', + 'both', + 'bottom', + 'but', + 'by', + 'call', + 'can', + 'cannot', + 'cant', + 'co', + 'con', + 'could', + 'couldnt', + 'cry', + 'de', + 'describe', + 'detail', + 'do', + 'done', + 'down', + 'due', + 'during', + 'each', + 'eg', + 'eight', + 'either', + 'eleven', + 'else', + 'elsewhere', + 'empty', + 'enough', + 'etc', + 'even', + 'ever', + 'every', + 'everyone', + 'everything', + 'everywhere', + 'except', + 'few', + 'fifteen', + 'fify', + 'fill', + 'find', + 'fire', + 'first', + 'five', + 'for', + 'former', + 'formerly', + 'forty', + 'found', + 'four', + 'from', + 'front', + 'full', + 'further', + 'get', + 'give', + 'go', + 'had', + 'has', + 'hasnt', + 'have', + 'he', + 'hence', + 'her', + 'here', + 'hereafter', + 'hereby', + 'herein', + 'hereupon', + 'hers', + 'herself', + 'him', + 'himself', + 'his', + 'how', + 'however', + 'hundred', + 'ie', + 'if', + 'in', + 'inc', + 'indeed', + 'interest', + 'into', + 'is', + 'it', + 'its', + 'itself', + 'keep', + 'last', + 'latter', + 'latterly', + 'least', + 'less', + 'ltd', + 'made', + 'many', + 'may', + 'me', + 'meanwhile', + 'might', + 'mill', + 'mine', + 'more', + 'moreover', + 'most', + 'mostly', + 'move', + 'much', + 'must', + 'my', + 'myself', + 'name', + 'namely', + 'neither', + 'never', + 'nevertheless', + 'next', + 'nine', + 'no', + 'nobody', + 'none', + 'noone', + 'nor', + 'not', + 'nothing', + 'now', + 'nowhere', + 'of', + 'off', + 'often', + 'on', + 'once', + 'one', + 'only', + 'onto', + 'or', + 'other', + 'others', + 'otherwise', + 'our', + 'ours', + 'ourselves', + 'out', + 'over', + 'own', + 'part', + 'per', + 'perhaps', + 'please', + 'put', + 'rather', + 're', + 'same', + 'see', + 'seem', + 'seemed', + 'seeming', + 'seems', + 'serious', + 'several', + 'she', + 'should', + 'show', + 'side', + 'since', + 'sincere', + 'six', + 'sixty', + 'so', + 'some', + 'somehow', + 'someone', + 'something', + 'sometime', + 'sometimes', + 'somewhere', + 'still', + 'such', + 'system', + 'take', + 'ten', + 'than', + 'that', + 'the', + 'their', + 'them', + 'themselves', + 'then', + 'thence', + 'there', + 'thereafter', + 'thereby', + 'therefore', + 'therein', + 'thereupon', + 'these', + 'they', + 'thickv', + 'thin', + 'third', + 'this', + 'those', + 'though', + 'three', + 'through', + 'throughout', + 'thru', + 'thus', + 'to', + 'together', + 'too', + 'top', + 'toward', + 'towards', + 'twelve', + 'twenty', + 'two', + 'un', + 'under', + 'until', + 'up', + 'upon', + 'us', + 'very', + 'via', + 'was', + 'we', + 'well', + 'were', + 'what', + 'whatever', + 'when', + 'whence', + 'whenever', + 'where', + 'whereafter', + 'whereas', + 'whereby', + 'wherein', + 'whereupon', + 'wherever', + 'whether', + 'which', + 'while', + 'whither', + 'who', + 'whoever', + 'whole', + 'whom', + 'whose', + 'why', + 'will', + 'with', + 'within', + 'without', + 'would', + 'yet', + 'you', + 'your', + 'yours', + 'yourself', + 'yourselves', + 'the', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/eo.php b/vendor/voku/stop-words/src/voku/helper/stopwords/eo.php new file mode 100644 index 000000000..fcca06fe1 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/eo.php @@ -0,0 +1,183 @@ +<?php + +// esperanto + +static $data = [ + 'adiaŭ', + 'ajn', + 'al', + 'ankoraŭ', + 'antaŭ', + 'aŭ', + 'bonan', + 'bonvole', + 'bonvolu', + 'bv', + 'ci', + 'cia', + 'cian', + 'cin', + 'd-ro', + 'da', + 'de', + 'dek', + 'deka', + 'do', + 'doktor\'', + 'doktoro', + 'du', + 'dua', + 'dum', + 'eble', + 'ekz', + 'ekzemple', + 'en', + 'estas', + 'estis', + 'estos', + 'estu', + 'estus', + 'eĉ', + 'f-no', + 'feliĉan', + 'for', + 'fraŭlino', + 'ha', + 'havas', + 'havis', + 'havos', + 'havu', + 'havus', + 'he', + 'ho', + 'hu', + 'ili', + 'ilia', + 'ilian', + 'ilin', + 'inter', + 'io', + 'ion', + 'iu', + 'iujn', + 'iun', + 'ja', + 'jam', + 'je', + 'jes', + 'k', + 'kaj', + 'ke', + 'kio', + 'kion', + 'kiu', + 'kiujn', + 'kiun', + 'kvankam', + 'kvar', + 'kvara', + 'kvazaŭ', + 'kvin', + 'kvina', + 'la', + 'li', + 'lia', + 'lian', + 'lin', + 'malantaŭ', + 'male', + 'malgraŭ', + 'mem', + 'mi', + 'mia', + 'mian', + 'min', + 'minus', + 'naŭ', + 'naŭa', + 'ne', + 'nek', + 'nenio', + 'nenion', + 'neniu', + 'neniun', + 'nepre', + 'ni', + 'nia', + 'nian', + 'nin', + 'nu', + 'nun', + 'nur', + 'ok', + 'oka', + 'oni', + 'onia', + 'onian', + 'onin', + 'plej', + 'pli', + 'plu', + 'plus', + 'por', + 'post', + 'preter', + 's-no', + 's-ro', + 'se', + 'sed', + 'sep', + 'sepa', + 'ses', + 'sesa', + 'si', + 'sia', + 'sian', + 'sin', + 'sinjor\'', + 'sinjorino', + 'sinjoro', + 'sub', + 'super', + 'supren', + 'sur', + 'tamen', + 'tio', + 'tion', + 'tiu', + 'tiujn', + 'tiun', + 'tra', + 'tri', + 'tria', + 'tuj', + 'tute', + 'unu', + 'unua', + 've', + 'verŝajne', + 'vi', + 'via', + 'vian', + 'vin', + 'ĉi', + 'ĉio', + 'ĉion', + 'ĉiu', + 'ĉiujn', + 'ĉiun', + 'ĉu', + 'ĝi', + 'ĝia', + 'ĝian', + 'ĝin', + 'ĝis', + 'ĵus', + 'ŝi', + 'ŝia', + 'ŝin', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/es.php b/vendor/voku/stop-words/src/voku/helper/stopwords/es.php new file mode 100644 index 000000000..5d90d0bad --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/es.php @@ -0,0 +1,323 @@ +<?php + +// spanish + +static $data = [ + 'de', + 'la', + 'que', + 'el', + 'en', + 'y', + 'a', + 'los', + 'del', + 'se', + 'las', + 'por', + 'un', + 'para', + 'con', + 'no', + 'una', + 'su', + 'al', + 'lo', + 'como', + 'más', + 'pero', + 'sus', + 'le', + 'ya', + 'o', + 'este', + 'sí', + 'porque', + 'esta', + 'entre', + 'cuando', + 'muy', + 'sin', + 'sobre', + 'también', + 'me', + 'hasta', + 'hay', + 'donde', + 'quien', + 'desde', + 'todo', + 'nos', + 'durante', + 'todos', + 'uno', + 'les', + 'ni', + 'contra', + 'otros', + 'ese', + 'eso', + 'ante', + 'ellos', + 'e', + 'esto', + 'mí', + 'antes', + 'algunos', + 'qué', + 'unos', + 'yo', + 'otro', + 'otras', + 'otra', + 'él', + 'tanto', + 'esa', + 'estos', + 'mucho', + 'quienes', + 'nada', + 'muchos', + 'cual', + 'poco', + 'ella', + 'estar', + 'estas', + 'algunas', + 'algo', + 'nosotros', + 'mi', + 'mis', + 'tú', + 'te', + 'ti', + 'tu', + 'tus', + 'ellas', + 'nosotras', + 'vosostros', + 'vosostras', + 'os', + 'mío', + 'mía', + 'míos', + 'mías', + 'tuyo', + 'tuya', + 'tuyos', + 'tuyas', + 'suyo', + 'suya', + 'suyos', + 'suyas', + 'nuestro', + 'nuestra', + 'nuestros', + 'nuestras', + 'vuestro', + 'vuestra', + 'vuestros', + 'vuestras', + 'esos', + 'esas', + 'estoy', + 'estás', + 'está', + 'estamos', + 'estáis', + 'están', + 'esté', + 'estés', + 'estemos', + 'estéis', + 'estén', + 'estaré', + 'estarás', + 'estará', + 'estaremos', + 'estaréis', + 'estarán', + 'estaría', + 'estarías', + 'estaríamos', + 'estaríais', + 'estarían', + 'estaba', + 'estabas', + 'estábamos', + 'estabais', + 'estaban', + 'estuve', + 'estuviste', + 'estuvo', + 'estuvimos', + 'estuvisteis', + 'estuvieron', + 'estuviera', + 'estuvieras', + 'estuviéramos', + 'estuvierais', + 'estuvieran', + 'estuviese', + 'estuvieses', + 'estuviésemos', + 'estuvieseis', + 'estuviesen', + 'estando', + 'estado', + 'estada', + 'estados', + 'estadas', + 'estad', + 'he', + 'has', + 'ha', + 'hemos', + 'habéis', + 'han', + 'haya', + 'hayas', + 'hayamos', + 'hayáis', + 'hayan', + 'habré', + 'habrás', + 'habrá', + 'habremos', + 'habréis', + 'habrán', + 'habría', + 'habrías', + 'habríamos', + 'habríais', + 'habrían', + 'había', + 'habías', + 'habíamos', + 'habíais', + 'habían', + 'hube', + 'hubiste', + 'hubo', + 'hubimos', + 'hubisteis', + 'hubieron', + 'hubiera', + 'hubieras', + 'hubiéramos', + 'hubierais', + 'hubieran', + 'hubiese', + 'hubieses', + 'hubiésemos', + 'hubieseis', + 'hubiesen', + 'habiendo', + 'habido', + 'habida', + 'habidos', + 'habidas', + 'soy', + 'eres', + 'es', + 'somos', + 'sois', + 'son', + 'sea', + 'seas', + 'seamos', + 'seáis', + 'sean', + 'seré', + 'serás', + 'será', + 'seremos', + 'seréis', + 'serán', + 'sería', + 'serías', + 'seríamos', + 'seríais', + 'serían', + 'era', + 'eras', + 'éramos', + 'erais', + 'eran', + 'fui', + 'fuiste', + 'fue', + 'fuimos', + 'fuisteis', + 'fueron', + 'fuera', + 'fueras', + 'fuéramos', + 'fuerais', + 'fueran', + 'fuese', + 'fueses', + 'fuésemos', + 'fueseis', + 'fuesen', + 'sintiendo', + 'sentido', + 'sentida', + 'sentidos', + 'sentidas', + 'siente', + 'sentid', + 'tengo', + 'tienes', + 'tiene', + 'tenemos', + 'tenéis', + 'tienen', + 'tenga', + 'tengas', + 'tengamos', + 'tengáis', + 'tengan', + 'tendré', + 'tendrás', + 'tendrá', + 'tendremos', + 'tendréis', + 'tendrán', + 'tendría', + 'tendrías', + 'tendríamos', + 'tendríais', + 'tendrían', + 'tenía', + 'tenías', + 'teníamos', + 'teníais', + 'tenían', + 'tuve', + 'tuviste', + 'tuvo', + 'tuvimos', + 'tuvisteis', + 'tuvieron', + 'tuviera', + 'tuvieras', + 'tuviéramos', + 'tuvierais', + 'tuvieran', + 'tuviese', + 'tuvieses', + 'tuviésemos', + 'tuvieseis', + 'tuviesen', + 'teniendo', + 'tenido', + 'tenida', + 'tenidos', + 'tenidas', + 'tened', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/et.php b/vendor/voku/stop-words/src/voku/helper/stopwords/et.php new file mode 100644 index 000000000..5ce33f5ad --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/et.php @@ -0,0 +1,45 @@ +<?php + +// estonian + +static $data = [ + 'aga', + 'ei', + 'et', + 'ja', + 'jah', + 'kas', + 'kui', + 'kõik', + 'ma', + 'me', + 'mida', + 'midagi', + 'mind', + 'minu', + 'mis', + 'mu', + 'mul', + 'mulle', + 'nad', + 'nii', + 'oled', + 'olen', + 'oli', + 'oma', + 'on', + 'pole', + 'sa', + 'seda', + 'see', + 'selle', + 'siin', + 'siis', + 'ta', + 'te', + 'ära', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/fi.php b/vendor/voku/stop-words/src/voku/helper/stopwords/fi.php new file mode 100644 index 000000000..6662ccf37 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/fi.php @@ -0,0 +1,245 @@ +<?php + +// finnish + +static $data = [ + 'olla', + 'olen', + 'olet', + 'on', + 'olemme', + 'olette', + 'ovat', + 'ole', + 'oli', + 'olisi', + 'olisit', + 'olisin', + 'olisimme', + 'olisitte', + 'olisivat', + 'olit', + 'olin', + 'olimme', + 'olitte', + 'olivat', + 'ollut', + 'olleet', + 'en', + 'et', + 'ei', + 'emme', + 'ette', + 'eivät', + 'minä', + 'minun', + 'minut', + 'minua', + 'minussa', + 'minusta', + 'minuun', + 'minulla', + 'minulta', + 'minulle', + 'sinä', + 'sinun', + 'sinut', + 'sinua', + 'sinussa', + 'sinusta', + 'sinuun', + 'sinulla', + 'sinulta', + 'sinulle', + 'hän', + 'hänen', + 'hänet', + 'häntä', + 'hänessä', + 'hänestä', + 'häneen', + 'hänellä', + 'häneltä', + 'hänelle', + 'me', + 'meidän', + 'meidät', + 'meitä', + 'meissä', + 'meistä', + 'meihin', + 'meillä', + 'meiltä', + 'meille', + 'te', + 'teidän', + 'teidät', + 'teitä', + 'teissä', + 'teistä', + 'teihin', + 'teillä', + 'teiltä', + 'teille', + 'he', + 'heidän', + 'heidät', + 'heitä', + 'heissä', + 'heistä', + 'heihin', + 'heillä', + 'heiltä', + 'heille', + 'tämä', + 'tämän', + 'tätä', + 'tässä', + 'tästä', + 'tähän', + 'tallä', + 'tältä', + 'tälle', + 'tänä', + 'täksi', + 'tuo', + 'tuon', + 'tuotä', + 'tuossa', + 'tuosta', + 'tuohon', + 'tuolla', + 'tuolta', + 'tuolle', + 'tuona', + 'tuoksi', + 'se', + 'sen', + 'sitä', + 'siinä', + 'siitä', + 'siihen', + 'sillä', + 'siltä', + 'sille', + 'sinä', + 'siksi', + 'nämä', + 'näiden', + 'näitä', + 'näissä', + 'näistä', + 'näihin', + 'näillä', + 'näiltä', + 'näille', + 'näinä', + 'näiksi', + 'nuo', + 'noiden', + 'noita', + 'noissa', + 'noista', + 'noihin', + 'noilla', + 'noilta', + 'noille', + 'noina', + 'noiksi', + 'ne', + 'niiden', + 'niitä', + 'niissä', + 'niistä', + 'niihin', + 'niillä', + 'niiltä', + 'niille', + 'niinä', + 'niiksi', + 'kuka', + 'kenen', + 'kenet', + 'ketä', + 'kenessä', + 'kenestä', + 'keneen', + 'kenellä', + 'keneltä', + 'kenelle', + 'kenenä', + 'keneksi', + 'ketkä', + 'keiden', + 'ketkä', + 'keitä', + 'keissä', + 'keistä', + 'keihin', + 'keillä', + 'keiltä', + 'keille', + 'keinä', + 'keiksi', + 'mikä', + 'minkä', + 'minkä', + 'mitä', + 'missä', + 'mistä', + 'mihin', + 'millä', + 'miltä', + 'mille', + 'minä', + 'miksi', + 'mitkä', + 'joka', + 'jonka', + 'jota', + 'jossa', + 'josta', + 'johon', + 'jolla', + 'jolta', + 'jolle', + 'jona', + 'joksi', + 'jotka', + 'joiden', + 'joita', + 'joissa', + 'joista', + 'joihin', + 'joilla', + 'joilta', + 'joille', + 'joina', + 'joiksi', + 'että', + 'ja', + 'jos', + 'koska', + 'kuin', + 'mutta', + 'niin', + 'sekä', + 'sillä', + 'tai', + 'vaan', + 'vai', + 'vaikka', + 'kanssa', + 'mukaan', + 'noin', + 'poikki', + 'yli', + 'kun', + 'niin', + 'nyt', + 'itse', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/fr.php b/vendor/voku/stop-words/src/voku/helper/stopwords/fr.php new file mode 100644 index 000000000..5df94e31e --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/fr.php @@ -0,0 +1,717 @@ +<?php + +// french + +static $data = [ + 'a', + 'A', + 'à', + 'afin', + 'ah', + 'ai', + 'aie', + 'aient', + 'aies', + 'ailleurs', + 'ainsi', + 'ait', + 'alentour', + 'alias', + 'allais', + 'allaient', + 'allait', + 'allons', + 'allez', + 'alors', + 'Ap.', + 'Apr.', + 'après', + 'après-demain', + 'arrière', + 'as', + 'assez', + 'attendu', + 'au', + 'aucun', + 'aucune', + 'au-dedans', + 'au-dehors', + 'au-delà', + 'au-dessous', + 'au-dessus', + 'au-devant', + 'audit', + 'aujourd\'', + 'aujourd\'hui', + 'auparavant', + 'auprès', + 'auquel', + 'aura', + 'aurai', + 'auraient', + 'aurais', + 'aurait', + 'auras', + 'aurez', + 'auriez', + 'aurions', + 'aurons', + 'auront', + 'aussi', + 'aussitôt', + 'autant', + 'autour', + 'autre', + 'autrefois', + 'autres', + 'autrui', + 'aux', + 'auxdites', + 'auxdits', + 'auxquelles', + 'auxquels', + 'avaient', + 'avais', + 'avait', + 'avant', + 'avant-hier', + 'avec', + 'avez', + 'aviez', + 'avions', + 'avoir', + 'avons', + 'ayant', + 'ayez', + 'ayons', + 'B', + 'bah', + 'banco', + 'bé', + 'beaucoup', + 'ben', + 'bien', + 'bientôt', + 'bis', + 'bon', + 'C', + 'c\'', + 'ç\'', + 'c.-à-d.', + 'Ca', + 'ça', + 'çà', + 'cahin-caha', + 'car', + 'ce', + '-ce', + 'céans', + 'ceci', + 'cela', + 'celle', + 'celle-ci', + 'celle-là', + 'celles', + 'celles-ci', + 'celles-là', + 'celui', + 'celui-ci', + 'celui-là', + 'cent', + 'cents', + 'cependant', + 'certain', + 'certaine', + 'certaines', + 'certains', + 'certes', + 'ces', + 'c\'est-à-dire', + 'cet', + 'cette', + 'ceux', + 'ceux-ci', + 'ceux-là', + 'cf.', + 'cg', + 'cgr', + 'chacun', + 'chacune', + 'chaque', + 'cher', + 'chez', + 'ci', + '-ci', + 'ci-après', + 'ci-dessous', + 'ci-dessus', + 'cinq', + 'cinquante', + 'cinquante-cinq', + 'cinquante-deux', + 'cinquante-et-un', + 'cinquante-huit', + 'cinquante-neuf', + 'cinquante-quatre', + 'cinquante-sept', + 'cinquante-six', + 'cinquante-trois', + 'cl', + 'cm', + 'cm²', + 'combien', + 'comme', + 'comment', + 'contrario', + 'contre', + 'crescendo', + 'D', + 'd\'', + 'd\'abord', + 'd\'accord', + 'd\'affilée', + 'd\'ailleurs', + 'dans', + 'd\'après', + 'd\'arrache-pied', + 'davantage', + 'de', + 'debout', + 'dedans', + 'dehors', + 'déjà', + 'delà', + 'demain', + 'd\'emblée', + 'depuis', + 'derechef', + 'derrière', + 'des', + 'dès', + 'desdites', + 'desdits', + 'désormais', + 'desquelles', + 'desquels', + 'dessous', + 'dessus', + 'deux', + 'devant', + 'devers', + 'dg', + 'die', + 'différentes', + 'différents', + 'dire', + 'dis', + 'disent', + 'dit', + 'dito', + 'divers', + 'diverses', + 'dix', + 'dix-huit', + 'dix-neuf', + 'dix-sept', + 'dl', + 'dm', + 'donc', + 'dont', + 'dorénavant', + 'douze', + 'du', + 'dû', + 'dudit', + 'duquel', + 'durant', + 'E', + 'eh', + 'elle', + '-elle', + 'elles', + '-elles', + 'en', + '\'en', + '-en', + 'encore', + 'enfin', + 'ensemble', + 'ensuite', + 'entre', + 'entre-temps', + 'envers', + 'environ', + 'es', + 'ès', + 'est', + 'et', + 'et/ou', + 'étaient', + 'étais', + 'était', + 'étant', + 'etc', + 'été', + 'êtes', + 'étiez', + 'étions', + 'être', + 'eu', + 'eue', + 'eues', + 'euh', + 'eûmes', + 'eurent', + 'eus', + 'eusse', + 'eussent', + 'eusses', + 'eussiez', + 'eussions', + 'eut', + 'eût', + 'eûtes', + 'eux', + 'exprès', + 'extenso', + 'extremis', + 'F', + 'facto', + 'fallait', + 'faire', + 'fais', + 'faisais', + 'faisait', + 'faisaient', + 'faisons', + 'fait', + 'faites', + 'faudrait', + 'faut', + 'fi', + 'flac', + 'fors', + 'fort', + 'forte', + 'fortiori', + 'frais', + 'fûmes', + 'fur', + 'furent', + 'fus', + 'fusse', + 'fussent', + 'fusses', + 'fussiez', + 'fussions', + 'fut', + 'fût', + 'fûtes', + 'G', + 'gr', + 'grosso', + 'guère', + 'H', + 'ha', + 'han', + 'haut', + 'hé', + 'hein', + 'hem', + 'heu', + 'hg', + 'hier', + 'hl', + 'holà', + 'hop', + 'hormis', + 'hors', + 'hui', + 'huit', + 'hum', + 'I', + 'ibidem', + 'ici', + 'ici-bas', + 'idem', + 'il', + '-il', + 'illico', + 'ils', + '-ils', + 'ipso', + 'item', + 'J', + 'j\'', + 'jadis', + 'jamais', + 'je', + '-je', + 'jusqu\'', + 'jusqu\'à', + 'jusqu\'au', + 'jusqu\'aux', + 'jusque', + 'juste', + 'l\'', + 'la', + '-la', + 'là', + '-là', + 'là-bas', + 'là-dedans', + 'là-dehors', + 'là-derrière', + 'là-dessous', + 'là-dessus', + 'là-devant', + 'là-haut', + 'laquelle', + 'l\'autre', + 'le', + '-le', + 'lequel', + 'les', + '-les', + 'lès', + 'lesquelles', + 'lesquels', + 'leur', + '-leur', + 'leurs', + 'lez', + 'loin', + 'l\'on', + 'longtemps', + 'lors', + 'lorsqu\'', + 'lorsque', + 'lui', + '-lui', + 'l\'un', + 'l\'une', + 'M', + 'm\'', + 'ma', + 'maint', + 'mainte', + 'maintenant', + 'maintes', + 'maints', + 'mais', + 'mal', + 'malgré', + 'me', + 'même', + 'mêmes', + 'mes', + 'mg', + 'mgr', + 'mieux', + 'mil', + 'mille', + 'milliards', + 'millions', + 'minima', + 'modo', + 'moi', + '-moi', + 'moins', + 'mon', + 'moult', + 'moyennant', + 'N', + 'n\'', + 'naguère', + 'ne', + 'néanmoins', + 'neuf', + 'ni', + 'non', + 'nonante', + 'nonobstant', + 'nos', + 'notre', + 'nous', + '-nous', + 'nul', + 'nulle', + 'O', + 'ô', + 'octante', + 'oh', + 'on', + '-on', + 'ont', + 'onze', + 'or', + 'ou', + 'où', + 'ouais', + 'oui', + 'outre', + 'P', + 'par', + 'parbleu', + 'parce', + 'par-ci', + 'par-delà', + 'par-derrière', + 'par-dessous', + 'par-dessus', + 'par-devant', + 'parfois', + 'par-là', + 'parmi', + 'partout', + 'pas', + 'passé', + 'passim', + 'pendant', + 'personne', + 'petto', + 'peu', + 'peut', + 'peuvent', + 'peux', + 'peut-être', + 'pis', + 'plus', + 'plusieurs', + 'plutôt', + 'point', + 'posteriori', + 'pour', + 'pourquoi', + 'pourtant', + 'préalable', + 'près', + 'presqu\'', + 'presque', + 'primo', + 'priori', + 'prou', + 'pu', + 'puis', + 'puisqu\'', + 'puisque', + 'Q', + 'qu\'', + 'qua', + 'quand', + 'quarante', + 'quarante-cinq', + 'quarante-deux', + 'quarante-et-un', + 'quarante-huit', + 'quarante-neuf', + 'quarante-quatre', + 'quarante-sept', + 'quarante-six', + 'quarante-trois', + 'quasi', + 'quatorze', + 'quatre', + 'quatre-vingt', + 'quatre-vingt-cinq', + 'quatre-vingt-deux', + 'quatre-vingt-dix', + 'quatre-vingt-dix-huit', + 'quatre-vingt-dix-neuf', + 'quatre-vingt-dix-sept', + 'quatre-vingt-douze', + 'quatre-vingt-huit', + 'quatre-vingt-neuf', + 'quatre-vingt-onze', + 'quatre-vingt-quatorze', + 'quatre-vingt-quatre', + 'quatre-vingt-quinze', + 'quatre-vingts', + 'quatre-vingt-seize', + 'quatre-vingt-sept', + 'quatre-vingt-six', + 'quatre-vingt-treize', + 'quatre-vingt-trois', + 'quatre-vingt-un', + 'quatre-vingt-une', + 'que', + 'quel', + 'quelle', + 'quelles', + 'quelqu\'', + 'quelque', + 'quelquefois', + 'quelques', + 'quelques-unes', + 'quelques-uns', + 'quelqu\'un', + 'quelqu\'une', + 'quels', + 'qui', + 'quiconque', + 'quinze', + 'quoi', + 'quoiqu\'', + 'quoique', + 'R', + 'revoici', + 'revoilà', + 'rien', + 'S', + 's\'', + 'sa', + 'sans', + 'sauf', + 'se', + 'secundo', + 'seize', + 'selon', + 'sensu', + 'sept', + 'septante', + 'sera', + 'serai', + 'seraient', + 'serais', + 'serait', + 'seras', + 'serez', + 'seriez', + 'serions', + 'serons', + 'seront', + 'ses', + 'si', + 'sic', + 'sine', + 'sinon', + 'sitôt', + 'situ', + 'six', + 'soi', + 'soient', + 'sois', + 'soit', + 'soixante', + 'soixante-cinq', + 'soixante-deux', + 'soixante-dix', + 'soixante-dix-huit', + 'soixante-dix-neuf', + 'soixante-dix-sept', + 'soixante-douze', + 'soixante-et-onze', + 'soixante-et-un', + 'soixante-et-une', + 'soixante-huit', + 'soixante-neuf', + 'soixante-quatorze', + 'soixante-quatre', + 'soixante-quinze', + 'soixante-seize', + 'soixante-sept', + 'soixante-six', + 'soixante-treize', + 'soixante-trois', + 'sommes', + 'son', + 'sont', + 'soudain', + 'sous', + 'souvent', + 'soyez', + 'soyons', + 'stricto', + 'suis', + 'sur', + 'sur-le-champ', + 'surtout', + 'sus', + 'T', + '-t', + 't\'', + 'ta', + 'tacatac', + 'tant', + 'tantôt', + 'tard', + 'te', + 'tel', + 'telle', + 'telles', + 'tels', + 'ter', + 'tes', + 'toi', + '-toi', + 'ton', + 'tôt', + 'toujours', + 'tous', + 'tout', + 'toute', + 'toutefois', + 'toutes', + 'treize', + 'trente', + 'trente-cinq', + 'trente-deux', + 'trente-et-un', + 'trente-huit', + 'trente-neuf', + 'trente-quatre', + 'trente-sept', + 'trente-six', + 'trente-trois', + 'très', + 'trois', + 'trop', + 'tu', + '-tu', + 'U', + 'un', + 'une', + 'unes', + 'uns', + 'USD', + 'V', + 'va', + 'vais', + 'vas', + 'vers', + 'veut', + 'veux', + 'via', + 'vice-versa', + 'vingt', + 'vingt-cinq', + 'vingt-deux', + 'vingt-huit', + 'vingt-neuf', + 'vingt-quatre', + 'vingt-sept', + 'vingt-six', + 'vingt-trois', + 'vis-à-vis', + 'vite', + 'vitro', + 'vivo', + 'voici', + 'voilà', + 'voire', + 'volontiers', + 'vos', + 'votre', + 'vous', + '-vous', + 'W', + 'X', + 'y', + '-y', + 'Z', + 'zéro', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/hi.php b/vendor/voku/stop-words/src/voku/helper/stopwords/hi.php new file mode 100644 index 000000000..8dbade8b1 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/hi.php @@ -0,0 +1,235 @@ +<?php + +// hindi + +static $data = [ + 'अंदर', + 'अत', + 'अदि', + 'अप', + 'अपना', + 'अपनि', + 'अपनी', + 'अपने', + 'अभि', + 'अभी', + 'आदि', + 'आप', + 'इंहिं', + 'इंहें', + 'इंहों', + 'इतयादि', + 'इत्यादि', + 'इन', + 'इनका', + 'इन्हीं', + 'इन्हें', + 'इन्हों', + 'इस', + 'इसका', + 'इसकि', + 'इसकी', + 'इसके', + 'इसमें', + 'इसि', + 'इसी', + 'इसे', + 'उंहिं', + 'उंहें', + 'उंहों', + 'उन', + 'उनका', + 'उनकि', + 'उनकी', + 'उनके', + 'उनको', + 'उन्हीं', + 'उन्हें', + 'उन्हों', + 'उस', + 'उसके', + 'उसि', + 'उसी', + 'उसे', + 'एक', + 'एवं', + 'एस', + 'एसे', + 'ऐसे', + 'ओर', + 'और', + 'कइ', + 'कई', + 'कर', + 'करता', + 'करते', + 'करना', + 'करने', + 'करें', + 'कहते', + 'कहा', + 'का', + 'काफि', + 'काफ़ी', + 'कि', + 'किंहें', + 'किंहों', + 'कितना', + 'किन्हें', + 'किन्हों', + 'किया', + 'किर', + 'किस', + 'किसि', + 'किसी', + 'किसे', + 'की', + 'कुछ', + 'कुल', + 'के', + 'को', + 'कोइ', + 'कोई', + 'कोन', + 'कोनसा', + 'कौन', + 'कौनसा', + 'गया', + 'घर', + 'जब', + 'जहाँ', + 'जहां', + 'जा', + 'जिंहें', + 'जिंहों', + 'जितना', + 'जिधर', + 'जिन', + 'जिन्हें', + 'जिन्हों', + 'जिस', + 'जिसे', + 'जीधर', + 'जेसा', + 'जेसे', + 'जैसा', + 'जैसे', + 'जो', + 'तक', + 'तब', + 'तरह', + 'तिंहें', + 'तिंहों', + 'तिन', + 'तिन्हें', + 'तिन्हों', + 'तिस', + 'तिसे', + 'तो', + 'था', + 'थि', + 'थी', + 'थे', + 'दबारा', + 'दवारा', + 'दिया', + 'दुसरा', + 'दुसरे', + 'दूसरे', + 'दो', + 'द्वारा', + 'न', + 'नहिं', + 'नहीं', + 'ना', + 'निचे', + 'निहायत', + 'नीचे', + 'ने', + 'पर', + 'पहले', + 'पुरा', + 'पूरा', + 'पे', + 'फिर', + 'बनि', + 'बनी', + 'बहि', + 'बही', + 'बहुत', + 'बाद', + 'बाला', + 'बिलकुल', + 'भि', + 'भितर', + 'भी', + 'भीतर', + 'मगर', + 'मानो', + 'मे', + 'में', + 'यदि', + 'यह', + 'यहाँ', + 'यहां', + 'यहि', + 'यही', + 'या', + 'यिह', + 'ये', + 'रखें', + 'रवासा', + 'रहा', + 'रहे', + 'ऱ्वासा', + 'लिए', + 'लिये', + 'लेकिन', + 'व', + 'वगेरह', + 'वरग', + 'वर्ग', + 'वह', + 'वहाँ', + 'वहां', + 'वहिं', + 'वहीं', + 'वाले', + 'वुह', + 'वे', + 'वग़ैरह', + 'संग', + 'सकता', + 'सकते', + 'सबसे', + 'सभि', + 'सभी', + 'साथ', + 'साबुत', + 'साभ', + 'सारा', + 'से', + 'सो', + 'हि', + 'ही', + 'हुअ', + 'हुआ', + 'हुइ', + 'हुई', + 'हुए', + 'हे', + 'हें', + 'है', + 'हैं', + 'हो', + 'होता', + 'होति', + 'होती', + 'होते', + 'होना', + 'होने', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/hr.php b/vendor/voku/stop-words/src/voku/helper/stopwords/hr.php new file mode 100644 index 000000000..98758bb0f --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/hr.php @@ -0,0 +1,189 @@ +<?php + +// croatian + +static $data = [ + 'a', + 'ako', + 'ali', + 'bi', + 'bih', + 'bila', + 'bili', + 'bilo', + 'bio', + 'bismo', + 'biste', + 'biti', + 'bumo', + 'da', + 'do', + 'duž', + 'ga', + 'hoće', + 'hoćemo', + 'hoćete', + 'hoćeš', + 'hoću', + 'i', + 'iako', + 'ih', + 'ili', + 'iz', + 'ja', + 'je', + 'jedna', + 'jedne', + 'jedno', + 'jer', + 'jesam', + 'jesi', + 'jesmo', + 'jest', + 'jeste', + 'jesu', + 'jim', + 'joj', + 'još', + 'ju', + 'kada', + 'kako', + 'kao', + 'koja', + 'koje', + 'koji', + 'kojima', + 'koju', + 'kroz', + 'li', + 'me', + 'mene', + 'meni', + 'mi', + 'mimo', + 'moj', + 'moja', + 'moje', + 'mu', + 'na', + 'nad', + 'nakon', + 'nam', + 'nama', + 'nas', + 'naš', + 'naša', + 'naše', + 'našeg', + 'ne', + 'nego', + 'neka', + 'neki', + 'nekog', + 'neku', + 'nema', + 'netko', + 'neće', + 'nećemo', + 'nećete', + 'nećeš', + 'neću', + 'nešto', + 'ni', + 'nije', + 'nikoga', + 'nikoje', + 'nikoju', + 'nisam', + 'nisi', + 'nismo', + 'niste', + 'nisu', + 'njega', + 'njegov', + 'njegova', + 'njegovo', + 'njemu', + 'njezin', + 'njezina', + 'njezino', + 'njih', + 'njihov', + 'njihova', + 'njihovo', + 'njim', + 'njima', + 'njoj', + 'nju', + 'no', + 'o', + 'od', + 'odmah', + 'on', + 'ona', + 'oni', + 'ono', + 'ova', + 'pa', + 'pak', + 'po', + 'pod', + 'pored', + 'prije', + 's', + 'sa', + 'sam', + 'samo', + 'se', + 'sebe', + 'sebi', + 'si', + 'smo', + 'ste', + 'su', + 'sve', + 'svi', + 'svog', + 'svoj', + 'svoja', + 'svoje', + 'svom', + 'ta', + 'tada', + 'taj', + 'tako', + 'te', + 'tebe', + 'tebi', + 'ti', + 'to', + 'toj', + 'tome', + 'tu', + 'tvoj', + 'tvoja', + 'tvoje', + 'u', + 'uz', + 'vam', + 'vama', + 'vas', + 'vaš', + 'vaša', + 'vaše', + 'već', + 'vi', + 'vrlo', + 'za', + 'zar', + 'će', + 'ćemo', + 'ćete', + 'ćeš', + 'ću', + 'što', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/hu.php b/vendor/voku/stop-words/src/voku/helper/stopwords/hu.php new file mode 100644 index 000000000..596d8c7d2 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/hu.php @@ -0,0 +1,209 @@ +<?php + +// hungarian + +static $data = [ + 'a', + 'ahogy', + 'ahol', + 'aki', + 'akik', + 'akkor', + 'alatt', + 'által', + 'általában', + 'amely', + 'amelyek', + 'amelyekben', + 'amelyeket', + 'amelyet', + 'amelynek', + 'ami', + 'amit', + 'amolyan', + 'amíg', + 'amikor', + 'át', + 'abban', + 'ahhoz', + 'annak', + 'arra', + 'arról', + 'az', + 'azok', + 'azon', + 'azt', + 'azzal', + 'azért', + 'aztán', + 'azután', + 'azonban', + 'bár', + 'be', + 'belül', + 'benne', + 'cikk', + 'cikkek', + 'cikkeket', + 'csak', + 'de', + 'e', + 'eddig', + 'egész', + 'egy', + 'egyes', + 'egyetlen', + 'egyéb', + 'egyik', + 'egyre', + 'ekkor', + 'el', + 'elég', + 'ellen', + 'elõ', + 'elõször', + 'elõtt', + 'elsõ', + 'én', + 'éppen', + 'ebben', + 'ehhez', + 'emilyen', + 'ennek', + 'erre', + 'ez', + 'ezt', + 'ezek', + 'ezen', + 'ezzel', + 'ezért', + 'és', + 'fel', + 'felé', + 'hanem', + 'hiszen', + 'hogy', + 'hogyan', + 'igen', + 'így', + 'illetve', + 'ill.', + 'ill', + 'ilyen', + 'ilyenkor', + 'ison', + 'ismét', + 'itt', + 'jó', + 'jól', + 'jobban', + 'kell', + 'kellett', + 'keresztül', + 'keressünk', + 'ki', + 'kívül', + 'között', + 'közül', + 'legalább', + 'lehet', + 'lehetett', + 'legyen', + 'lenne', + 'lenni', + 'lesz', + 'lett', + 'maga', + 'magát', + 'majd', + 'majd', + 'már', + 'más', + 'másik', + 'meg', + 'még', + 'mellett', + 'mert', + 'mely', + 'melyek', + 'mi', + 'mit', + 'míg', + 'miért', + 'milyen', + 'mikor', + 'minden', + 'mindent', + 'mindenki', + 'mindig', + 'mint', + 'mintha', + 'mivel', + 'most', + 'nagy', + 'nagyobb', + 'nagyon', + 'ne', + 'néha', + 'nekem', + 'neki', + 'nem', + 'néhány', + 'nélkül', + 'nincs', + 'olyan', + 'ott', + 'össze', + 'õ', + 'õk', + 'õket', + 'pedig', + 'persze', + 'rá', + 's', + 'saját', + 'sem', + 'semmi', + 'sok', + 'sokat', + 'sokkal', + 'számára', + 'szemben', + 'szerint', + 'szinte', + 'talán', + 'tehát', + 'teljes', + 'tovább', + 'továbbá', + 'több', + 'úgy', + 'ugyanis', + 'új', + 'újabb', + 'újra', + 'után', + 'utána', + 'utolsó', + 'vagy', + 'vagyis', + 'valaki', + 'valami', + 'valamint', + 'való', + 'vagyok', + 'van', + 'vannak', + 'volt', + 'voltam', + 'voltak', + 'voltunk', + 'vissza', + 'vele', + 'viszont', + 'volna', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/id.php b/vendor/voku/stop-words/src/voku/helper/stopwords/id.php new file mode 100644 index 000000000..6e4ef1781 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/id.php @@ -0,0 +1,367 @@ +<?php + +// indonesian + +static $data = [ + 'ada', + 'adanya', + 'adalah', + 'adapun', + 'agak', + 'agaknya', + 'agar', + 'akan', + 'akankah', + 'akhirnya', + 'aku', + 'akulah', + 'amat', + 'amatlah', + 'anda', + 'andalah', + 'antar', + 'diantaranya', + 'antara', + 'antaranya', + 'diantara', + 'apa', + 'apaan', + 'mengapa', + 'apabila', + 'apakah', + 'apalagi', + 'apatah', + 'atau', + 'ataukah', + 'ataupun', + 'bagai', + 'bagaikan', + 'sebagai', + 'sebagainya', + 'bagaimana', + 'bagaimanapun', + 'sebagaimana', + 'bagaimanakah', + 'bagi', + 'bahkan', + 'bahwa', + 'bahwasanya', + 'sebaliknya', + 'banyak', + 'sebanyak', + 'beberapa', + 'seberapa', + 'begini', + 'beginian', + 'beginikah', + 'beginilah', + 'sebegini', + 'begitu', + 'begitukah', + 'begitulah', + 'begitupun', + 'sebegitu', + 'belum', + 'belumlah', + 'sebelum', + 'sebelumnya', + 'sebenarnya', + 'berapa', + 'berapakah', + 'berapalah', + 'berapapun', + 'betulkah', + 'sebetulnya', + 'biasa', + 'biasanya', + 'bila', + 'bilakah', + 'bisa', + 'bisakah', + 'sebisanya', + 'boleh', + 'bolehkah', + 'bolehlah', + 'buat', + 'bukan', + 'bukankah', + 'bukanlah', + 'bukannya', + 'cuma', + 'percuma', + 'dahulu', + 'dalam', + 'dan', + 'dapat', + 'dari', + 'daripada', + 'dekat', + 'demi', + 'demikian', + 'demikianlah', + 'sedemikian', + 'dengan', + 'depan', + 'di', + 'dia', + 'dialah', + 'dini', + 'diri', + 'dirinya', + 'terdiri', + 'dong', + 'dulu', + 'enggak', + 'enggaknya', + 'entah', + 'entahlah', + 'terhadap', + 'terhadapnya', + 'hal', + 'hampir', + 'hanya', + 'hanyalah', + 'harus', + 'haruslah', + 'harusnya', + 'seharusnya', + 'hendak', + 'hendaklah', + 'hendaknya', + 'hingga', + 'sehingga', + 'ia', + 'ialah', + 'ibarat', + 'ingin', + 'inginkah', + 'inginkan', + 'ini', + 'inikah', + 'inilah', + 'itu', + 'itukah', + 'itulah', + 'jangan', + 'jangankan', + 'janganlah', + 'jika', + 'jikalau', + 'juga', + 'justru', + 'kala', + 'kalau', + 'kalaulah', + 'kalaupun', + 'kalian', + 'kami', + 'kamilah', + 'kamu', + 'kamulah', + 'kan', + 'kapan', + 'kapankah', + 'kapanpun', + 'dikarenakan', + 'karena', + 'karenanya', + 'ke', + 'kecil', + 'kemudian', + 'kenapa', + 'kepada', + 'kepadanya', + 'ketika', + 'seketika', + 'khususnya', + 'kini', + 'kinilah', + 'kiranya', + 'sekiranya', + 'kita', + 'kitalah', + 'kok', + 'lagi', + 'lagian', + 'selagi', + 'lah', + 'lain', + 'lainnya', + 'melainkan', + 'selaku', + 'lalu', + 'melalui', + 'terlalu', + 'lama', + 'lamanya', + 'selama', + 'selama', + 'selamanya', + 'lebih', + 'terlebih', + 'bermacam', + 'macam', + 'semacam', + 'maka', + 'makanya', + 'makin', + 'malah', + 'malahan', + 'mampu', + 'mampukah', + 'mana', + 'manakala', + 'manalagi', + 'masih', + 'masihkah', + 'semasih', + 'masing', + 'mau', + 'maupun', + 'semaunya', + 'memang', + 'mereka', + 'merekalah', + 'meski', + 'meskipun', + 'semula', + 'mungkin', + 'mungkinkah', + 'nah', + 'namun', + 'nanti', + 'nantinya', + 'nyaris', + 'oleh', + 'olehnya', + 'seorang', + 'seseorang', + 'pada', + 'padanya', + 'padahal', + 'paling', + 'sepanjang', + 'pantas', + 'sepantasnya', + 'sepantasnyalah', + 'para', + 'pasti', + 'pastilah', + 'per', + 'pernah', + 'pula', + 'pun', + 'merupakan', + 'rupanya', + 'serupa', + 'saat', + 'saatnya', + 'sesaat', + 'saja', + 'sajalah', + 'saling', + 'bersama', + 'sama', + 'sesama', + 'sambil', + 'sampai', + 'sana', + 'sangat', + 'sangatlah', + 'saya', + 'sayalah', + 'se', + 'sebab', + 'sebabnya', + 'sebuah', + 'tersebut', + 'tersebutlah', + 'sedang', + 'sedangkan', + 'sedikit', + 'sedikitnya', + 'segala', + 'segalanya', + 'segera', + 'sesegera', + 'sejak', + 'sejenak', + 'sekali', + 'sekalian', + 'sekalipun', + 'sesekali', + 'sekaligus', + 'sekarang', + 'sekarang', + 'sekitar', + 'sekitarnya', + 'sela', + 'selain', + 'selalu', + 'seluruh', + 'seluruhnya', + 'semakin', + 'sementara', + 'sempat', + 'semua', + 'semuanya', + 'sendiri', + 'sendirinya', + 'seolah', + 'seperti', + 'sepertinya', + 'sering', + 'seringnya', + 'serta', + 'siapa', + 'siapakah', + 'siapapun', + 'disini', + 'disinilah', + 'sini', + 'sinilah', + 'sesuatu', + 'sesuatunya', + 'suatu', + 'sesudah', + 'sesudahnya', + 'sudah', + 'sudahkah', + 'sudahlah', + 'supaya', + 'tadi', + 'tadinya', + 'tak', + 'tanpa', + 'setelah', + 'telah', + 'tentang', + 'tentu', + 'tentulah', + 'tentunya', + 'tertentu', + 'seterusnya', + 'tapi', + 'tetapi', + 'setiap', + 'tiap', + 'setidaknya', + 'tidak', + 'tidakkah', + 'tidaklah', + 'toh', + 'waduh', + 'wah', + 'wahai', + 'sewaktu', + 'walau', + 'walaupun', + 'wong', + 'yaitu', + 'yakni', + 'yang', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/it.php b/vendor/voku/stop-words/src/voku/helper/stopwords/it.php new file mode 100644 index 000000000..1f7781ae6 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/it.php @@ -0,0 +1,290 @@ +<?php + +// italian + +static $data = [ + 'ad', + 'al', + 'allo', + 'ai', + 'agli', + 'all', + 'agl', + 'alla', + 'alle', + 'con', + 'col', + 'coi', + 'da', + 'dal', + 'dallo', + 'dai', + 'dagli', + 'dall', + 'dagl', + 'dalla', + 'dalle', + 'di', + 'del', + 'dello', + 'dei', + 'degli', + 'dell', + 'degl', + 'della', + 'delle', + 'in', + 'nel', + 'nello', + 'nei', + 'negli', + 'nell', + 'negl', + 'nella', + 'nelle', + 'su', + 'sul', + 'sullo', + 'sui', + 'sugli', + 'sull', + 'sugl', + 'sulla', + 'sulle', + 'per', + 'tra', + 'contro', + 'io', + 'tu', + 'lui', + 'lei', + 'noi', + 'voi', + 'loro', + 'mio', + 'mia', + 'miei', + 'mie', + 'tuo', + 'tua', + 'tuoi', + 'tue', + 'suo', + 'sua', + 'suoi', + 'sue', + 'nostro', + 'nostra', + 'nostri', + 'nostre', + 'vostro', + 'vostra', + 'vostri', + 'vostre', + 'mi', + 'ti', + 'ci', + 'vi', + 'lo', + 'la', + 'li', + 'le', + 'gli', + 'ne', + 'il', + 'un', + 'uno', + 'una', + 'ma', + 'ed', + 'se', + 'perché', + 'anche', + 'come', + 'dov', + 'dove', + 'che', + 'chi', + 'cui', + 'non', + 'più', + 'quale', + 'quanto', + 'quanti', + 'quanta', + 'quante', + 'quello', + 'quelli', + 'quella', + 'quelle', + 'questo', + 'questi', + 'questa', + 'queste', + 'si', + 'tutto', + 'tutti', + 'a', + 'c', + 'e', + 'i', + 'l', + 'o', + 'ho', + 'hai', + 'ha', + 'abbiamo', + 'avete', + 'hanno', + 'abbia', + 'abbiate', + 'abbiano', + 'avrò', + 'avrai', + 'avrà', + 'avremo', + 'avrete', + 'avranno', + 'avrei', + 'avresti', + 'avrebbe', + 'avremmo', + 'avreste', + 'avrebbero', + 'avevo', + 'avevi', + 'aveva', + 'avevamo', + 'avevate', + 'avevano', + 'ebbi', + 'avesti', + 'ebbe', + 'avemmo', + 'aveste', + 'ebbero', + 'avessi', + 'avesse', + 'avessimo', + 'avessero', + 'avendo', + 'avuto', + 'avuta', + 'avuti', + 'avute', + 'sono', + 'sei', + 'è', + 'siamo', + 'siete', + 'sia', + 'siate', + 'siano', + 'sarò', + 'sarai', + 'sarà', + 'saremo', + 'sarete', + 'saranno', + 'sarei', + 'saresti', + 'sarebbe', + 'saremmo', + 'sareste', + 'sarebbero', + 'ero', + 'eri', + 'era', + 'eravamo', + 'eravate', + 'erano', + 'fui', + 'fosti', + 'fu', + 'fummo', + 'foste', + 'furono', + 'fossi', + 'fosse', + 'fossimo', + 'fossero', + 'essendo', + 'faccio', + 'fai', + 'facciamo', + 'fanno', + 'faccia', + 'facciate', + 'facciano', + 'farò', + 'farai', + 'farà', + 'faremo', + 'farete', + 'faranno', + 'farei', + 'faresti', + 'farebbe', + 'faremmo', + 'fareste', + 'farebbero', + 'facevo', + 'facevi', + 'faceva', + 'facevamo', + 'facevate', + 'facevano', + 'feci', + 'facesti', + 'fece', + 'facemmo', + 'faceste', + 'fecero', + 'facessi', + 'facesse', + 'facessimo', + 'facessero', + 'facendo', + 'sto', + 'stai', + 'sta', + 'stiamo', + 'stanno', + 'stia', + 'stiate', + 'stiano', + 'starò', + 'starai', + 'starà', + 'staremo', + 'starete', + 'staranno', + 'starei', + 'staresti', + 'starebbe', + 'staremmo', + 'stareste', + 'starebbero', + 'stavo', + 'stavi', + 'stava', + 'stavamo', + 'stavate', + 'stavano', + 'stetti', + 'stesti', + 'stette', + 'stemmo', + 'steste', + 'stettero', + 'stessi', + 'stesse', + 'stessimo', + 'stessero', + 'stando', +]; + +$result =& $data; +unset($data); +return $result; + diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/ka.php b/vendor/voku/stop-words/src/voku/helper/stopwords/ka.php new file mode 100644 index 000000000..39d4ec97d --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/ka.php @@ -0,0 +1,383 @@ +<?php + +// georgian + +static $data = [ + 'ა.შ.', + 'აგერ', + 'აგრეთვე', + 'ალბათ', + 'ამაზე', + 'ამას', + 'ამასთან', + 'ამასთანავე', + 'ამგვარად', + 'ამდენად', + 'ამით', + 'ამის', + 'ამისთვის', + 'ამიტომ', + 'ამიტომაც', + 'ამჟამად', + 'ამჯერად', + 'ან', + 'ანუ', + 'არ', + 'არა', + 'არადა', + 'არათუ', + 'არამარტო', + 'არამედ', + 'არამხოლოდ', + 'არანაკლებ', + 'არასოდეს', + 'არაუადრეს', + 'არაუგვიანეს', + 'არაუმეტეს', + 'არსად', + 'არსაიდან', + 'არც', + 'არცერთ', + 'ასევე', + 'ასეც', + 'აქამდე', + 'აღარ', + 'აღარც', + 'ბოლოს', + 'ბოლოსკენ', + 'გამო', + 'გამუდმებით', + 'განსაკუთრებით', + 'გარდა', + 'გარეშე', + 'და', + 'დასასრულს', + 'დასაწყისში', + 'დროულად', + 'ე.ი.', + 'ე.წ.', + 'ეგებ', + 'ერთადერთი', + 'ერთადერთმა', + 'ერთ-ერთი', + 'ერთხელ', + 'ესოდე', + 'ვერ', + 'ვითომ', + 'ვინაიდან', + 'ვინძლო', + 'ვისაც', + 'ზემოაღნიშნულმა', + 'ზოგჯერ', + 'თავად', + 'თავადაც', + 'თავადვე', + 'თავდაპირველად', + 'თავიდანვე', + 'თავის მხრივ', + 'თან', + 'თანაც', + 'თანახმადაც', + 'თანდათან', + 'თვით', + 'თვითონ', + 'თვითონაც', + 'თვითონვე', + 'თითოეულმა', + 'თითქოს', + 'თუ', + 'თუკი', + 'თუმცა', + 'თუმცაღა', + 'თუნდაც', + 'იმავდროულად', + 'იმავე', + 'იმან', + 'იმას', + 'იმდენად', + 'იმთავითვე', + 'იმით', + 'იმის', + 'იმისთვის', + 'იმიტომ', + 'ისევე', + 'ისეთი', + 'ისეც', + 'იშვიათად', + 'კერძოდ', + 'კვლავ', + 'კი', + 'კიდევ', + 'მაგალითად', + 'მაგან', + 'მაგას', + 'მაგით', + 'მაგის', + 'მაგრამ', + 'მათი', + 'მაინც', + 'მანამ', + 'მანამდე', + 'მართალია', + 'მარტო', + 'მაშასადამე', + 'მაშინ', + 'მაშინვე', + 'მერე', + 'მეტად', + 'მთელი', + 'მიერ', + 'მით', + 'მიმართ', + 'მისივე', + 'მსგავსი', + 'მხოლოდ', + 'ნაწილობრივ', + 'ნეტავ', + 'ნეტავი', + 'ნუ', + 'ნურასოდეს', + 'ნურც', + 'ნუღარ', + 'ნუღარც', + 'ოდენ', + 'ოდესღაც', + 'ოღონდ', + 'პირველი', + 'პირიქით', + 'პრინციპში', + 'რადგან', + 'რადგანაც', + 'რათა', + 'რაკი', + 'რამდენად', + 'რამდენადაც', + 'რამეთუ', + 'რამენაირად', + 'რამეფრად', + 'რანაირადაც', + 'რასაკვირველია', + 'რასაც', + 'რაღაც', + 'რაც', + 'რითაც', + 'რისთვისაც', + 'როგორადაც', + 'როგორიც', + 'როგორიცაა', + 'როგორღაც', + 'როგორც', + 'როდესაც', + 'როდესღაც', + 'რომ', + 'რომელიმე', + 'რომელიც', + 'რომელსაც', + 'რომლებიც', + 'რომლითაც', + 'რომლის', + 'როცა', + 'საბოლოოდ', + 'სადაც', + 'სადღაც', + 'საერთოდ', + 'სათანადოდ', + 'საიდანაც', + 'სამომავლოდ', + 'სანამ', + 'სანამდე', + 'სრულად', + 'სულ', + 'სწორედ', + 'სხვადასხვა', + 'სხვები', + 'უკვე', + 'უნდა', + 'უსათუოდ', + 'უფრო', + 'უცებ', + 'უცნაურად', + 'ფაქტობრივად', + 'ყველა', + 'ყოველგვარი', + 'ყოველთვის', + 'ყოველი', + 'ყოველივე', + 'შედარებით', + 'შედეგად', + 'შემდგომ', + 'შემდგომში', + 'შემდეგ', + 'შესახებ', + 'შორის', + 'ჩვეულებრივ', + 'წინააღმდეგ', + 'წინაშე', + 'ხან', + 'ხოლმე', + 'ხოლო', + 'ხშირად', + 'ჯერაც', + 'ჯერჯერობით', + 'ამის გარდა', + 'ამის გარეშე', + 'ამის მიუხედავად', + 'ამასთან ერთად', + 'ამის მიხედვით', + 'ამის ნაცვლად', + 'ამის პასუხად', + 'ამასთან შედარებით', + 'ამბობს, რომ', + 'ამ დროს', + 'ამ თემაზე', + 'ამ მიზნით', + 'ამის საპირისპიროდ', + 'ამის გამო', + 'ამ მხრივ', + 'ამის უარსაყოფად', + 'ამის შედეგად', + 'ამ შემთხვევაში', + 'ამავე დროს', + 'ამას გარდა', + 'ამასთან დაკავშირებით', + 'ამის შემდეგ', + 'ამის შესაბამისად', + 'ამის შესახებ', + 'ამისგან განსხვავებით', + 'არა მარტო', + 'არა მხოლოდ', + 'არა უადრეს', + 'არა უგვიანეს', + 'არც ერთი', + 'არც კი', + 'არც მეორე', + 'ასე ვთქვათ', + 'ასე მაგალითად', + 'ასე რომ', + 'ასე შემდეგ', + 'ასევე განიხილავს', + 'აქედან გამომდინარე', + 'აქედან დასკვნა', + 'აღნიშნა რომ', + 'აღნიშნულთან დაკავშირებით', + 'აცხადებს რომ', + 'ბოლო ერთი', + 'ბოლო პერიოდში', + 'ბოლო წლებში', + 'გამოთქვა იმედი', + 'განაცხადა, რომ', + 'განმარტა, რომ', + 'გარდა ამისა', + 'გარშემო არსებული', + 'და სხვ.', + 'და სხვა', + 'დაადასტურა, რომ', + 'ეგრეთ წოდებული', + 'ეგრეთ წოდებულმა', + 'ერთი თვალსაზრისით', + 'ერთი მხრივ', + 'ერთის მხრივ', + 'ეს კი', + 'ესე იგი', + 'ვიდრე არ', + 'თავიდან ბოლომდე', + 'თუ რამდენად', + 'თუ როგორ', + 'იგივეა რაც', + 'იმ შემთხვევაში', + 'იმაზე მეტი', + 'იმაზე, რომ', + 'იმას, რომ', + 'იმასთან დაკავშირებით', + 'იმდენად რამდენადაც', + 'იმედი გამოთქვა', + 'იმის გამო', + 'იმის თაობაზე', + 'იმის საწინააღმდეგოდ', + 'იმისათვის, რომ', + 'იმისთვის, რათა', + 'იმისთვის, რომ', + 'იმიტომ, რომ', + 'ის, რომელიც', + 'ისე როგორც', + 'ისე, რომ', + 'ისევე როგორც', + 'ისეთი როგორიც', + 'იქიდან გამომდინარე', + 'კიდევ ერთხელ', + 'მაგრამ თუ', + 'მათ შორის', + 'მათი ვარაუდით', + 'მანამ, სანამ', + 'მას შემდეგ', + 'მაშინ, როცა', + 'მაშინაც კი', + 'მეორე მხრივ', + 'მეორეც ერთი', + 'მერე მეორე', + 'მით უფრო', + 'მიიჩნევს, რომ', + 'მისი განმარტებით', + 'მისი თქმით', + 'მისივე თქმით', + 'მიუხედავად ამისა', + 'ნურც კი', + 'პირველ რიგში', + 'რა დროსაც', + 'რა მიზეზითაც', + 'რაც შეეხება', + 'რაც შეიძლება', + 'რის გამოც', + 'რის საფუძველზედაც', + 'რის საფუძველზეც', + 'რის შედეგადაც', + 'რის შემდეგაც', + 'როგორც კი', + 'რომ არა', + 'რომ თუ', + 'რომელთა გამოც', + 'რომლის თანახმად', + 'რომლის თანახმადაც', + 'რომლის მიხედვითაც', + 'რომლის შესახებ', + 'საკითხთან დაკავშირებით', + 'სულ მცირე', + 'სულ ცოტა', + 'სხვა კუთხით', + 'სხვა მხრივ', + 'სხვა რამ', + 'სხვათა შორის', + 'უფრო მეტიც', + 'ყოველივე ეს', + 'შემდეგ უკვე', + 'ჩვენი განცხადებით', + 'ჯერ ერთი', + 'ჯერ კიდევ', + 'ამ ბოლო დროს', + 'ამა თუ იმ', + 'ასე თუ ისე', + 'აქედან ჩანს, რომ', + 'ბოლოს და ბოლოს', + 'გამომდინარე იქიდან, რომ', + 'და ასე შემდეგ', + 'ვინაიდან და რადგანაც', + 'თუ რის საფუძველზე', + 'იმის გათვალისწინებით, რომ', + 'იმის გამო, რომ', + 'იმის ნაცვლად, რომ', + 'ისევ და ისევ', + 'იქვე აღნიშნა, რომ', + 'იქიდან გამომდინარე, რომ', + 'კიდევ და კიდევ', + 'მაინც და მაინც', + 'მას შემდეგ, რაც', + 'მიუხედავად იმისა, თუ', + 'მიუხედავად იმისა, რომ', + 'როგორც უკვე ითქვა', + 'როდის და რატომ', + 'უფრო და უფრო', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/lt.php b/vendor/voku/stop-words/src/voku/helper/stopwords/lt.php new file mode 100644 index 000000000..3b707ce61 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/lt.php @@ -0,0 +1,484 @@ +<?php + +// lithuanian + +static $data = [ + 'abi', + 'abidvi', + 'abiejose', + 'abiejuose', + 'abiejø', + 'abiem', + 'abigaliai', + 'abipus', + 'abu', + 'abudu', + 'ai', + 'ana', + 'anaiptol', + 'anaisiais', + 'anajai', + 'anajam', + 'anajame', + 'anapus', + 'anas', + 'anasai', + 'anasis', + 'anei', + 'aniedvi', + 'anieji', + 'aniesiems', + 'anoji', + 'anojo', + 'anojoje', + 'anokia', + 'anoks', + 'anosiomis', + 'anosioms', + 'anosios', + 'anosiose', + 'anot', + 'ant', + 'antai', + 'anuodu', + 'anuoju', + 'anuosiuose', + 'anuosius', + 'anàja', + 'anàjà', + 'anàjá', + 'anàsias', + 'anøjø', + 'apie', + 'aplink', + 'ar', + 'arba', + 'argi', + 'arti', + 'aukðèiau', + 'að', + 'be', + 'bei', + 'beje', + 'bemaþ', + 'bent', + 'bet', + 'betgi', + 'beveik', + 'dar', + 'dargi', + 'daugmaþ', + 'deja', + 'dëka', + 'dël', + 'dëlei', + 'dëlto', + 'ech', + 'et', + 'gal', + 'galbût', + 'galgi', + 'gan', + 'gana', + 'gi', + 'greta', + 'idant', + 'iki', + 'ir', + 'irgi', + 'it', + 'itin', + 'ið', + 'iðilgai', + 'iðvis', + 'jaisiais', + 'jajai', + 'jajam', + 'jajame', + 'jei', + 'jeigu', + 'ji', + 'jiedu', + 'jiedvi', + 'jieji', + 'jiesiems', + 'jinai', + 'jis', + 'jisai', + 'jog', + 'joji', + 'jojo', + 'jojoje', + 'jokia', + 'joks', + 'josiomis', + 'josioms', + 'josios', + 'josiose', + 'judu', + 'judvi', + 'juk', + 'jumis', + 'jums', + 'jumyse', + 'juodu', + 'juoju', + 'juosiuose', + 'juosius', + 'jus', + 'jàja', + 'jàjà', + 'jàsias', + 'jájá', + 'jøjø', + 'jûs', + 'jûsiðkis', + 'jûsiðkë', + 'jûsø', + 'kad', + 'kada', + 'kadangi', + 'kai', + 'kaip', + 'kaipgi', + 'kas', + 'katra', + 'katras', + 'katriedvi', + 'katruodu', + 'kaþin', + 'kaþkas', + 'kaþkatra', + 'kaþkatras', + 'kaþkokia', + 'kaþkoks', + 'kaþkuri', + 'kaþkuris', + 'kiaurai', + 'kiek', + 'kiekvienas', + 'kieno', + 'kita', + 'kitas', + 'kitokia', + 'kitoks', + 'kodël', + 'kokia', + 'koks', + 'kol', + 'kolei', + 'kone', + 'kuomet', + 'kur', + 'kurgi', + 'kuri', + 'kuriedvi', + 'kuris', + 'kuriuodu', + 'lai', + 'lig', + 'ligi', + 'link', + 'lyg', + 'man', + 'manaisiais', + 'manajai', + 'manajam', + 'manajame', + 'manas', + 'manasai', + 'manasis', + 'mane', + 'manieji', + 'maniesiems', + 'manim', + 'manimi', + 'maniðkis', + 'maniðkë', + 'mano', + 'manoji', + 'manojo', + 'manojoje', + 'manosiomis', + 'manosioms', + 'manosios', + 'manosiose', + 'manuoju', + 'manuosiuose', + 'manuosius', + 'manyje', + 'manàja', + 'manàjà', + 'manàjá', + 'manàsias', + 'manæs', + 'manøjø', + 'mat', + 'maþdaug', + 'maþne', + 'mes', + 'mudu', + 'mudvi', + 'mumis', + 'mums', + 'mumyse', + 'mus', + 'mûsiðkis', + 'mûsiðkë', + 'mûsø', + 'na', + 'nagi', + 'ne', + 'nebe', + 'nebent', + 'negi', + 'negu', + 'nei', + 'nejau', + 'nejaugi', + 'nekaip', + 'nelyginant', + 'nes', + 'net', + 'netgi', + 'netoli', + 'neva', + 'nors', + 'nuo', + 'në', + 'o', + 'ogi', + 'oi', + 'paeiliui', + 'pagal', + 'pakeliui', + 'palaipsniui', + 'palei', + 'pas', + 'pasak', + 'paskos', + 'paskui', + 'paskum', + 'pat', + 'pati', + 'patiems', + 'paties', + 'pats', + 'patys', + 'patá', + 'paèiais', + 'paèiam', + 'paèiame', + 'paèiu', + 'paèiuose', + 'paèius', + 'paèiø', + 'per', + 'pernelyg', + 'pirm', + 'pirma', + 'pirmiau', + 'po', + 'prie', + 'prieð', + 'prieðais', + 'pro', + 'pusiau', + 'rasi', + 'rodos', + 'sau', + 'savaisiais', + 'savajai', + 'savajam', + 'savajame', + 'savas', + 'savasai', + 'savasis', + 'save', + 'savieji', + 'saviesiems', + 'savimi', + 'saviðkis', + 'saviðkë', + 'savo', + 'savoji', + 'savojo', + 'savojoje', + 'savosiomis', + 'savosioms', + 'savosios', + 'savosiose', + 'savuoju', + 'savuosiuose', + 'savuosius', + 'savyje', + 'savàja', + 'savàjà', + 'savàjá', + 'savàsias', + 'savæs', + 'savøjø', + 'skersai', + 'skradþiai', + 'staèiai', + 'su', + 'sulig', + 'ta', + 'tad', + 'tai', + 'taigi', + 'taip', + 'taipogi', + 'taisiais', + 'tajai', + 'tajam', + 'tajame', + 'tamsta', + 'tarp', + 'tarsi', + 'tartum', + 'tarytum', + 'tas', + 'tasai', + 'tau', + 'tavaisiais', + 'tavajai', + 'tavajam', + 'tavajame', + 'tavas', + 'tavasai', + 'tavasis', + 'tave', + 'tavieji', + 'taviesiems', + 'tavimi', + 'taviðkis', + 'taviðkë', + 'tavo', + 'tavoji', + 'tavojo', + 'tavojoje', + 'tavosiomis', + 'tavosioms', + 'tavosios', + 'tavosiose', + 'tavuoju', + 'tavuosiuose', + 'tavuosius', + 'tavyje', + 'tavàja', + 'tavàjà', + 'tavàjá', + 'tavàsias', + 'tavæs', + 'tavøjø', + 'taèiau', + 'te', + 'tegu', + 'tegul', + 'tiedvi', + 'tieji', + 'ties', + 'tiesiems', + 'tiesiog', + 'tik', + 'tikriausiai', + 'tiktai', + 'toji', + 'tojo', + 'tojoje', + 'tokia', + 'toks', + 'tol', + 'tolei', + 'toliau', + 'tosiomis', + 'tosioms', + 'tosios', + 'tosiose', + 'tu', + 'tuodu', + 'tuoju', + 'tuosiuose', + 'tuosius', + 'turbût', + 'tàja', + 'tàjà', + 'tàjá', + 'tàsias', + 'tøjø', + 'tûlas', + 'uþ', + 'uþtat', + 'uþvis', + 'va', + 'vai', + 'viduj', + 'vidury', + 'vien', + 'vienas', + 'vienokia', + 'vienoks', + 'vietoj', + 'virð', + 'virðuj', + 'virðum', + 'vis', + 'vis dëlto', + 'visa', + 'visas', + 'visgi', + 'visokia', + 'visoks', + 'vos', + 'vël', + 'vëlgi', + 'ypaè', + 'á', + 'ákypai', + 'ástriþai', + 'ðalia', + 'ðe', + 'ði', + 'ðiaisiais', + 'ðiajai', + 'ðiajam', + 'ðiajame', + 'ðiapus', + 'ðiedvi', + 'ðieji', + 'ðiesiems', + 'ðioji', + 'ðiojo', + 'ðiojoje', + 'ðiokia', + 'ðioks', + 'ðiosiomis', + 'ðiosioms', + 'ðiosios', + 'ðiosiose', + 'ðis', + 'ðisai', + 'ðit', + 'ðita', + 'ðitas', + 'ðitiedvi', + 'ðitokia', + 'ðitoks', + 'ðituodu', + 'ðiuodu', + 'ðiuoju', + 'ðiuosiuose', + 'ðiuosius', + 'ðiàja', + 'ðiàjà', + 'ðiàsias', + 'ðiøjø', + 'ðtai', + 'ðájá', + 'þemiau', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/lv.php b/vendor/voku/stop-words/src/voku/helper/stopwords/lv.php new file mode 100644 index 000000000..437f28ccd --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/lv.php @@ -0,0 +1,171 @@ +<?php + +// latvian + +static $data = [ + 'aiz', + 'ap', + 'apakš', + 'apakšpus', + 'ar', + 'arī', + 'augšpus', + 'bet', + 'bez', + 'bija', + 'biji', + 'biju', + 'bijām', + 'bijāt', + 'būs', + 'būsi', + 'būsiet', + 'būsim', + 'būt', + 'būšu', + 'caur', + 'diemžēl', + 'diezin', + 'droši', + 'dēļ', + 'esam', + 'esat', + 'esi', + 'esmu', + 'gan', + 'gar', + 'iekam', + 'iekams', + 'iekām', + 'iekāms', + 'iekš', + 'iekšpus', + 'ik', + 'ir', + 'it', + 'itin', + 'iz', + 'ja', + 'jau', + 'jeb', + 'jebšu', + 'jel', + 'jo', + 'jā', + 'ka', + 'kamēr', + 'kaut', + 'kolīdz', + 'kopš', + 'kā', + 'kļuva', + 'kļuvi', + 'kļuvu', + 'kļuvām', + 'kļuvāt', + 'kļūs', + 'kļūsi', + 'kļūsiet', + 'kļūsim', + 'kļūst', + 'kļūstam', + 'kļūstat', + 'kļūsti', + 'kļūstu', + 'kļūt', + 'kļūšu', + 'labad', + 'lai', + 'lejpus', + 'līdz', + 'līdzko', + 'ne', + 'nebūt', + 'nedz', + 'nekā', + 'nevis', + 'nezin', + 'no', + 'nu', + 'nē', + 'otrpus', + 'pa', + 'par', + 'pat', + 'pie', + 'pirms', + 'pret', + 'priekš', + 'pār', + 'pēc', + 'starp', + 'tad', + 'tak', + 'tapi', + 'taps', + 'tapsi', + 'tapsiet', + 'tapsim', + 'tapt', + 'tapāt', + 'tapšu', + 'taču', + 'te', + 'tiec', + 'tiek', + 'tiekam', + 'tiekat', + 'tieku', + 'tik', + 'tika', + 'tikai', + 'tiki', + 'tikko', + 'tiklab', + 'tiklīdz', + 'tiks', + 'tiksiet', + 'tiksim', + 'tikt', + 'tiku', + 'tikvien', + 'tikām', + 'tikāt', + 'tikšu', + 'tomēr', + 'topat', + 'turpretim', + 'turpretī', + 'tā', + 'tādēļ', + 'tālab', + 'tāpēc', + 'un', + 'uz', + 'vai', + 'var', + 'varat', + 'varēja', + 'varēji', + 'varēju', + 'varējām', + 'varējāt', + 'varēs', + 'varēsi', + 'varēsiet', + 'varēsim', + 'varēt', + 'varēšu', + 'vien', + 'virs', + 'virspus', + 'vis', + 'viņpus', + 'zem', + 'ārpus', + 'šaipus', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/nl.php b/vendor/voku/stop-words/src/voku/helper/stopwords/nl.php new file mode 100644 index 000000000..197539180 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/nl.php @@ -0,0 +1,111 @@ +<?php + +// dutch + +static $data = [ + 'de', + 'en', + 'van', + 'ik', + 'te', + 'dat', + 'die', + 'in', + 'een', + 'hij', + 'het', + 'niet', + 'zijn', + 'is', + 'was', + 'op', + 'aan', + 'met', + 'als', + 'voor', + 'had', + 'er', + 'maar', + 'om', + 'hem', + 'dan', + 'zou', + 'of', + 'wat', + 'mijn', + 'men', + 'dit', + 'zo', + 'door', + 'over', + 'ze', + 'zich', + 'bij', + 'ook', + 'tot', + 'je', + 'mij', + 'uit', + 'der', + 'daar', + 'haar', + 'naar', + 'heb', + 'hoe', + 'heeft', + 'hebben', + 'deze', + 'u', + 'want', + 'nog', + 'zal', + 'me', + 'zij', + 'nu', + 'ge', + 'geen', + 'omdat', + 'iets', + 'worden', + 'toch', + 'al', + 'waren', + 'veel', + 'meer', + 'doen', + 'toen', + 'moet', + 'ben', + 'zonder', + 'kan', + 'hun', + 'dus', + 'alles', + 'onder', + 'ja', + 'eens', + 'hier', + 'wie', + 'werd', + 'altijd', + 'doch', + 'wordt', + 'wezen', + 'kunnen', + 'ons', + 'zelf', + 'tegen', + 'na', + 'reeds', + 'wil', + 'kon', + 'niets', + 'uw', + 'iemand', + 'geweest', + 'andere', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/no.php b/vendor/voku/stop-words/src/voku/helper/stopwords/no.php new file mode 100644 index 000000000..0892d34ce --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/no.php @@ -0,0 +1,186 @@ +<?php + +// norwegian + +static $data = [ + 'og', + 'i', + 'jeg', + 'det', + 'at', + 'en', + 'et', + 'den', + 'til', + 'er', + 'som', + 'på', + 'de', + 'med', + 'han', + 'av', + 'ikke', + 'ikkje', + 'der', + 'så', + 'var', + 'meg', + 'seg', + 'men', + 'ett', + 'har', + 'om', + 'vi', + 'min', + 'mitt', + 'ha', + 'hadde', + 'hun', + 'nå', + 'over', + 'da', + 'ved', + 'fra', + 'du', + 'ut', + 'sin', + 'dem', + 'oss', + 'opp', + 'man', + 'kan', + 'hans', + 'hvor', + 'eller', + 'hva', + 'skal', + 'selv', + 'sjøl', + 'her', + 'alle', + 'vil', + 'bli', + 'ble', + 'blei', + 'blitt', + 'kunne', + 'inn', + 'når', + 'være', + 'kom', + 'noen', + 'noe', + 'ville', + 'dere', + 'som', + 'deres', + 'kun', + 'ja', + 'etter', + 'ned', + 'skulle', + 'denne', + 'for', + 'deg', + 'si', + 'sine', + 'sitt', + 'mot', + 'å', + 'meget', + 'hvorfor', + 'dette', + 'disse', + 'uten', + 'hvordan', + 'ingen', + 'din', + 'ditt', + 'blir', + 'samme', + 'hvilken', + 'hvilke', + 'sånn', + 'inni', + 'mellom', + 'vår', + 'hver', + 'hvem', + 'vors', + 'hvis', + 'både', + 'bare', + 'enn', + 'fordi', + 'før', + 'mange', + 'også', + 'slik', + 'vært', + 'være', + 'båe', + 'begge', + 'siden', + 'dykk', + 'dykkar', + 'dei', + 'deira', + 'deires', + 'deim', + 'di', + 'då', + 'eg', + 'ein', + 'eit', + 'eitt', + 'elles', + 'honom', + 'hjå', + 'ho', + 'hoe', + 'henne', + 'hennar', + 'hennes', + 'hoss', + 'hossen', + 'ikkje', + 'ingi', + 'inkje', + 'korleis', + 'korso', + 'kva', + 'kvar', + 'kvarhelst', + 'kven', + 'kvi', + 'kvifor', + 'me', + 'medan', + 'mi', + 'mine', + 'mykje', + 'no', + 'nokon', + 'noka', + 'nokor', + 'noko', + 'nokre', + 'si', + 'sia', + 'sidan', + 'so', + 'somt', + 'somme', + 'um', + 'upp', + 'vere', + 'vore', + 'verte', + 'vort', + 'varte', + 'vart', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/pl.php b/vendor/voku/stop-words/src/voku/helper/stopwords/pl.php new file mode 100644 index 000000000..fd3577585 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/pl.php @@ -0,0 +1,148 @@ +<?php + +// polish + +static $data = [ + 'ach', + 'aj', + 'albo', + 'bardzo', + 'bez', + 'bo', + 'być', + 'ci', + 'cię', + 'ciebie', + 'co', + 'czy', + 'daleko', + 'dla', + 'dlaczego', + 'dlatego', + 'do', + 'dobrze', + 'dokąd', + 'dość', + 'dużo', + 'dwa', + 'dwaj', + 'dwie', + 'dwoje', + 'dziś', + 'dzisiaj', + 'gdyby', + 'gdzie', + 'go', + 'ich', + 'ile', + 'im', + 'inny', + 'ja', + 'ją', + 'jak', + 'jakby', + 'jaki', + 'je', + 'jeden', + 'jedna', + 'jedno', + 'jego', + 'jej', + 'jemu', + 'jeśli', + 'jest', + 'jestem', + 'jeżeli', + 'już', + 'każdy', + 'kiedy', + 'kierunku', + 'kto', + 'ku', + 'lub', + 'ma', + 'mają', + 'mam', + 'mi', + 'mną', + 'mnie', + 'moi', + 'mój', + 'moja', + 'moje', + 'może', + 'mu', + 'my', + 'na', + 'nam', + 'nami', + 'nas', + 'nasi', + 'nasz', + 'nasza', + 'nasze', + 'natychmiast', + 'nią', + 'nic', + 'nich', + 'nie', + 'niego', + 'niej', + 'niemu', + 'nigdy', + 'nim', + 'nimi', + 'niż', + 'obok', + 'od', + 'około', + 'on', + 'ona', + 'one', + 'oni', + 'ono', + 'owszem', + 'po', + 'pod', + 'ponieważ', + 'przed', + 'przedtem', + 'są', + 'sam', + 'sama', + 'się', + 'skąd', + 'tak', + 'taki', + 'tam', + 'ten', + 'to', + 'tobą', + 'tobie', + 'tu', + 'tutaj', + 'twoi', + 'twój', + 'twoja', + 'twoje', + 'ty', + 'wam', + 'wami', + 'was', + 'wasi', + 'wasz', + 'wasza', + 'wasze', + 'we', + 'więc', + 'wszystko', + 'wtedy', + 'wy', + 'żaden', + 'zawsze', + 'że', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/pt.php b/vendor/voku/stop-words/src/voku/helper/stopwords/pt.php new file mode 100644 index 000000000..41cd3e4e5 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/pt.php @@ -0,0 +1,214 @@ +<?php + +// portuguese + +static $data = [ + 'de', + 'a', + 'o', + 'que', + 'e', + 'do', + 'da', + 'em', + 'um', + 'para', + 'com', + 'não', + 'uma', + 'os', + 'no', + 'se', + 'na', + 'por', + 'mais', + 'as', + 'dos', + 'como', + 'mas', + 'ao', + 'ele', + 'das', + 'à', + 'seu', + 'sua', + 'ou', + 'quando', + 'muito', + 'nos', + 'já', + 'eu', + 'também', + 'só', + 'pelo', + 'pela', + 'até', + 'isso', + 'ela', + 'entre', + 'depois', + 'sem', + 'mesmo', + 'aos', + 'seus', + 'quem', + 'nas', + 'me', + 'esse', + 'eles', + 'você', + 'essa', + 'num', + 'nem', + 'suas', + 'meu', + 'às', + 'minha', + 'numa', + 'pelos', + 'elas', + 'qual', + 'nós', + 'lhe', + 'deles', + 'essas', + 'esses', + 'pelas', + 'este', + 'dele', + 'tu', + 'te', + 'vocês', + 'vos', + 'lhes', + 'meus', + 'minhas', + 'teu', + 'tua', + 'teus', + 'tuas', + 'nosso', + 'nossa', + 'nossos', + 'nossas', + 'dela', + 'delas', + 'esta', + 'estes', + 'estas', + 'aquele', + 'aquela', + 'aqueles', + 'aquelas', + 'isto', + 'aquilo', + 'estou', + 'está', + 'estamos', + 'estão', + 'estive', + 'esteve', + 'estivemos', + 'estiveram', + 'estava', + 'estávamos', + 'estavam', + 'estivera', + 'estivéramos', + 'esteja', + 'estejamos', + 'estejam', + 'estivesse', + 'estivéssemos', + 'estivessem', + 'estiver', + 'estivermos', + 'estiverem', + 'hei', + 'há', + 'havemos', + 'hão', + 'houve', + 'houvemos', + 'houveram', + 'houvera', + 'houvéramos', + 'haja', + 'hajamos', + 'hajam', + 'houvesse', + 'houvéssemos', + 'houvessem', + 'houver', + 'houvermos', + 'houverem', + 'houverei', + 'houverá', + 'houveremos', + 'houverão', + 'houveria', + 'houveríamos', + 'houveriam', + 'sou', + 'somos', + 'são', + 'era', + 'éramos', + 'eram', + 'fui', + 'foi', + 'fomos', + 'foram', + 'fora', + 'fôramos', + 'seja', + 'sejamos', + 'sejam', + 'fosse', + 'fôssemos', + 'fossem', + 'for', + 'formos', + 'forem', + 'serei', + 'será', + 'seremos', + 'serão', + 'seria', + 'seríamos', + 'seriam', + 'tenho', + 'tem', + 'temos', + 'tém', + 'tinha', + 'tínhamos', + 'tinham', + 'tive', + 'teve', + 'tivemos', + 'tiveram', + 'tivera', + 'tivéramos', + 'tenha', + 'tenhamos', + 'tenham', + 'tivesse', + 'tivéssemos', + 'tivessem', + 'tiver', + 'tivermos', + 'tiverem', + 'terei', + 'terá', + 'teremos', + 'terão', + 'teria', + 'teríamos', + 'teriam', +]; + +$result =& $data; +unset($data); +return $result; + diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/ro.php b/vendor/voku/stop-words/src/voku/helper/stopwords/ro.php new file mode 100644 index 000000000..c7246d667 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/ro.php @@ -0,0 +1,268 @@ +<?php + +// romanian + +static $data = [ + 'vreo', + 'acelea', + 'cita', + 'degraba', + 'lor', + 'alta', + 'tot', + 'ai', + 'dat', + 'x', + 'despre', + 'peste', + 'bine', + 'dar', + 'foarte', + 'z', + 'avea', + 'multi', + 'cit', + 'alt', + 'mai', + 'sa', + 'fie', + 'tu', + 'multe', + 'e', + 'orice', + 'dintr', + 'se', + 'g', + 'intr', + 'niste', + 'multa', + 'insa', + 'il', + 'fost', + 'a', + 'abia', + 'nimic', + 'sub', + 'acel', + 'in', + 'altceva', + 'si', + 'avem', + 'altfel', + 'c', + 'ea', + 'acest', + 'li', + 'parca', + 'fi', + 'dintre', + 'unele', + 'm', + 'acestei', + 'mare', + 'cel', + 'este', + 'pe', + 'atitia', + 'uneori', + 'acela', + 'iti', + 'astazi', + 'acestui', + 'o', + 'imi', + 'ele', + 'ceilalti', + 'pai', + 'fata', + 'noua', + 'sa-ti', + 'altul', + 'au', + 'i', + 'prin', + 'conform', + 'aceste', + 'anume', + 'azi', + 'k', + 'unul', + 'ala', + 'unei', + 'fara', + 'ei', + 'la', + 'aceeasi', + 'u', + 'inapoi', + 'acestea', + 'acesta', + 'catre', + 'sale', + 'asupra', + 'as', + 'aceea', + 'ba', + 'ale', + 'da', + 'le', + 'apoi', + 'aia', + 'suntem', + 'cum', + 'isi', + 'inainte', + 's', + 'de', + 'cind', + 'cumva', + 'chiar', + 'acestia', + 'daca', + 'sunt', + 'care', + 'al', + 'numai', + 'cui', + 'sus', + 'tocmai', + 'prea', + 'cu', + 'mi', + 'eu', + 'doar', + 'niciodata', + 'exact', + 'putini', + 'aiurea', + 'tuturor', + 'celor', + 'astfel', + 'atunci', + 'citeva', + 'cat', + 'sau', + 'fel', + 'intre', + 'acolo', + 'nostri', + 'ma', + 'mult', + 'una', + 'ceea', + 'iar', + 'sintem', + 'ati', + 'din', + 'geaba', + 'sai', + 'caruia', + 'adica', + 'inca', + 'are', + 'aici', + 'ca', + 'ia', + 'nici', + 'd', + 'oricum', + 'asta', + 'carora', + 'face', + 'citiva', + 'voi', + 'unor', + 'f', + 'atat', + 'toata', + 'alaturi', + 'cea', + 'nu', + 'totusi', + 'ce', + 'altii', + 'acum', + 'sint', + 'capat', + 'mod', + 'deasupra', + 'cam', + 'vom', + 'b', + 'toate', + 'careia', + 'aceasta', + 'atit', + 'nimeni', + 'ii', + 'ci', + 'unde', + 'ul', + 'plus', + 'era', + 'sa-mi', + 'l', + 'spre', + 'dupa', + 'nou', + 'cele', + 'acea', + 'un', + 'incit', + 'n', + 'cei', + 'or', + 'va', + 'deci', + 'acelasi', + 'atatea', + 'h', + 'vor', + 'decit', + 'noi', + 'cineva', + 'desi', + 'ceva', + 'j', + 'ului', + 'atitea', + 'avut', + 'ar', + 'pina', + 't', + 'atata', + 'unui', + 'el', + 'citi', + 'asa', + 'totul', + 'pentru', + 'atita', + 'v', + 'alti', + 'asemenea', + 'atatia', + 'te', + 'ne', + 'deja', + 'unii', + 'p', + 'atare', + 'cite', + 'cine', + 'cand', + 'toti', + 'vreun', + 'ori', + 'r', + 'alte', + 'lui', + 'ti', + 'ni', + 'aceia', + 'am', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/ru.php b/vendor/voku/stop-words/src/voku/helper/stopwords/ru.php new file mode 100644 index 000000000..0af9776b6 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/ru.php @@ -0,0 +1,161 @@ +<?php + +// russian + +static $data = [ + 'и', + 'в', + 'во', + 'не', + 'что', + 'он', + 'на', + 'я', + 'с', + 'со', + 'как', + 'а', + 'то', + 'все', + 'она', + 'так', + 'его', + 'но', + 'да', + 'ты', + 'к', + 'у', + 'же', + 'вы', + 'за', + 'бы', + 'по', + 'только', + 'ее', + 'мне', + 'было', + 'вот', + 'от', + 'меня', + 'еще', + 'нет', + 'о', + 'из', + 'ему', + 'теперь', + 'когда', + 'даже', + 'ну', + 'вдруг', + 'ли', + 'если', + 'уже', + 'или', + 'ни', + 'быть', + 'был', + 'него', + 'до', + 'вас', + 'нибудь', + 'опять', + 'уж', + 'вам', + 'ведь', + 'там', + 'потом', + 'себя', + 'ничего', + 'ей', + 'может', + 'они', + 'тут', + 'где', + 'есть', + 'надо', + 'ней', + 'для', + 'мы', + 'тебя', + 'их', + 'чем', + 'была', + 'сам', + 'чтоб', + 'без', + 'будто', + 'чего', + 'раз', + 'тоже', + 'себе', + 'под', + 'будет', + 'ж', + 'тогда', + 'кто', + 'этот', + 'того', + 'потому', + 'этого', + 'какой', + 'совсем', + 'ним', + 'здесь', + 'этом', + 'один', + 'почти', + 'мой', + 'тем', + 'чтобы', + 'нее', + 'сейчас', + 'были', + 'куда', + 'зачем', + 'всех', + 'никогда', + 'можно', + 'при', + 'наконец', + 'два', + 'об', + 'другой', + 'хоть', + 'после', + 'над', + 'больше', + 'тот', + 'через', + 'эти', + 'нас', + 'про', + 'всего', + 'них', + 'какая', + 'много', + 'разве', + 'три', + 'эту', + 'моя', + 'впрочем', + 'хорошо', + 'свою', + 'этой', + 'перед', + 'иногда', + 'лучше', + 'чуть', + 'том', + 'нельзя', + 'такой', + 'им', + 'более', + 'всегда', + 'конечно', + 'всю', + 'между', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/sk.php b/vendor/voku/stop-words/src/voku/helper/stopwords/sk.php new file mode 100644 index 000000000..0145fa0d3 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/sk.php @@ -0,0 +1,183 @@ +<?php + +// slovak + +static $data = [ + 'a', + 'aby', + 'aj', + 'ak', + 'ako', + 'ale', + 'alebo', + 'and', + 'ani', + 'áno', + 'asi', + 'až', + 'bez', + 'bude', + 'budem', + 'budeš', + 'budeme', + 'budete', + 'budú', + 'by', + 'bol', + 'bola', + 'boli', + 'bolo', + 'byť', + 'cez', + 'čo', + 'či', + 'ďalší', + 'ďalšia', + 'ďalšie', + 'dnes', + 'do', + 'ho', + 'ešte', + 'for', + 'i', + 'ja', + 'je', + 'jeho', + 'jej', + 'ich', + 'iba', + 'iné', + 'iný', + 'som', + 'si', + 'sme', + 'sú', + 'k', + 'kam', + 'každý', + 'každá', + 'každé', + 'každí', + 'kde', + 'keď', + 'kto', + 'ktorá', + 'ktoré', + 'ktorou', + 'ktorý', + 'ktorí', + 'ku', + 'lebo', + 'len', + 'ma', + 'mať', + 'má', + 'máte', + 'medzi', + 'mi', + 'mna', + 'mne', + 'mnou', + 'musieť', + 'môcť', + 'môj', + 'môže', + 'my', + 'na', + 'nad', + 'nám', + 'náš', + 'naši', + 'nie', + 'nech', + 'než', + 'nič', + 'niektorý', + 'nové', + 'nový', + 'nová', + 'nové', + 'noví', + 'o', + 'od', + 'odo', + 'of', + 'on', + 'ona', + 'ono', + 'oni', + 'ony', + 'po', + 'pod', + 'podľa', + 'pokiaľ', + 'potom', + 'práve', + 'pre', + 'prečo', + 'preto', + 'pretože', + 'prvý', + 'prvá', + 'prvé', + 'prví', + 'pred', + 'predo', + 'pri', + 'pýta', + 's', + 'sa', + 'so', + 'si', + 'svoje', + 'svoj', + 'svojich', + 'svojím', + 'svojími', + 'ta', + 'tak', + 'takže', + 'táto', + 'teda', + 'te', + 'tě', + 'ten', + 'tento', + 'the', + 'tieto', + 'tým', + 'týmto', + 'tiež', + 'to', + 'toto', + 'toho', + 'tohoto', + 'tom', + 'tomto', + 'tomuto', + 'toto', + 'tu', + 'tú', + 'túto', + 'tvoj', + 'ty', + 'tvojími', + 'už', + 'v', + 'vám', + 'váš', + 'vaše', + 'vo', + 'viac', + 'však', + 'všetok', + 'vy', + 'z', + 'za', + 'zo', + 'že', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/sv.php b/vendor/voku/stop-words/src/voku/helper/stopwords/sv.php new file mode 100644 index 000000000..9b432713a --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/sv.php @@ -0,0 +1,124 @@ +<?php + +// swedish + +static $data = [ + 'och', + 'det', + 'att', + 'i', + 'en', + 'jag', + 'hon', + 'som', + 'han', + 'på', + 'den', + 'med', + 'var', + 'sig', + 'för', + 'så', + 'till', + 'är', + 'men', + 'ett', + 'om', + 'hade', + 'de', + 'av', + 'icke', + 'mig', + 'du', + 'henne', + 'då', + 'sin', + 'nu', + 'har', + 'inte', + 'hans', + 'honom', + 'skulle', + 'hennes', + 'där', + 'min', + 'man', + 'ej', + 'vid', + 'kunde', + 'något', + 'från', + 'ut', + 'när', + 'efter', + 'upp', + 'vi', + 'dem', + 'vara', + 'vad', + 'över', + 'än', + 'dig', + 'kan', + 'sina', + 'här', + 'ha', + 'mot', + 'alla', + 'under', + 'någon', + 'eller', + 'allt', + 'mycket', + 'sedan', + 'ju', + 'denna', + 'själv', + 'detta', + 'åt', + 'utan', + 'varit', + 'hur', + 'ingen', + 'mitt', + 'ni', + 'bli', + 'blev', + 'oss', + 'din', + 'dessa', + 'några', + 'deras', + 'blir', + 'mina', + 'samma', + 'vilken', + 'er', + 'sådan', + 'vår', + 'blivit', + 'dess', + 'inom', + 'mellan', + 'sådant', + 'varför', + 'varje', + 'vilka', + 'ditt', + 'vem', + 'vilket', + 'sitta', + 'sådana', + 'vart', + 'dina', + 'vars', + 'vårt', + 'våra', + 'ert', + 'era', + 'vilkas', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/tr.php b/vendor/voku/stop-words/src/voku/helper/stopwords/tr.php new file mode 100644 index 000000000..e0c9d3750 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/tr.php @@ -0,0 +1,63 @@ +<?php + +// turkish + +static $data = [ + 'acaba', + 'ama', + 'aslında', + 'az', + 'bazı', + 'belki', + 'biri', + 'birkaç', + 'birşey', + 'biz', + 'bu', + 'çok', + 'çünkü', + 'da', + 'daha', + 'de', + 'defa', + 'diye', + 'eğer', + 'en', + 'gibi', + 'hem', + 'hep', + 'hepsi', + 'her', + 'hiç', + 'için', + 'ile', + 'ise', + 'kez', + 'ki', + 'kim', + 'mı', + 'mu', + 'mü', + 'nasıl', + 'ne', + 'neden', + 'nerde', + 'nerede', + 'nereye', + 'niçin', + 'niye', + 'o', + 'sanki', + 'şey', + 'siz', + 'şu', + 'tüm', + 've', + 'veya', + 'ya', + 'yani', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/uk.php b/vendor/voku/stop-words/src/voku/helper/stopwords/uk.php new file mode 100644 index 000000000..7300e2857 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/uk.php @@ -0,0 +1,395 @@ +<?php + +// ukrainian + +static $data = [ + 'a', + 'б', + 'в', + 'г', + 'е', + 'ж', + 'з', + 'м', + 'т', + 'у', + 'я', + 'є', + 'і', + 'аж', + 'ви', + 'де', + 'до', + 'за', + 'зі', + 'ми', + 'на', + 'не', + 'ну', + 'нх', + 'ні', + 'по', + 'та', + 'ти', + 'то', + 'ту', + 'ті', + 'це', + 'цю', + 'ця', + 'ці', + 'чи', + 'ще', + 'що', + 'як', + 'їй', + 'їм', + 'їх', + 'її', + 'або', + 'але', + 'ало', + 'без', + 'був', + 'вам', + 'вас', + 'ваш', + 'вже', + 'все', + 'всю', + 'вся', + 'від', + 'він', + 'два', + 'дві', + 'для', + 'ким', + 'мож', + 'моя', + 'моє', + 'мої', + 'міг', + 'між', + 'мій', + 'над', + 'нам', + 'нас', + 'наш', + 'нею', + 'неї', + 'них', + 'ніж', + 'ній', + 'ось', + 'при', + 'про', + 'під', + 'пір', + 'раз', + 'рік', + 'сам', + 'сих', + 'сім', + 'так', + 'там', + 'теж', + 'тим', + 'тих', + 'той', + 'тою', + 'три', + 'тут', + 'хоч', + 'хто', + 'цей', + 'цим', + 'цих', + 'час', + 'щоб', + 'яка', + 'які', + 'адже', + 'буде', + 'буду', + 'будь', + 'була', + 'були', + 'було', + 'бути', + 'вами', + 'ваша', + 'ваше', + 'ваші', + 'весь', + 'вниз', + 'вона', + 'вони', + 'воно', + 'всею', + 'всім', + 'всіх', + 'втім', + 'геть', + 'далі', + 'двох', + 'день', + 'дуже', + 'зате', + 'його', + 'йому', + 'каже', + 'кого', + 'коли', + 'кому', + 'крім', + 'куди', + 'лише', + 'люди', + 'мало', + 'мати', + 'мене', + 'мені', + 'миру', + 'мною', + 'може', + 'нами', + 'наша', + 'наше', + 'наші', + 'ними', + 'ніби', + 'один', + 'поки', + 'пора', + 'рано', + 'року', + 'році', + 'сама', + 'саме', + 'саму', + 'самі', + 'свою', + 'своє', + 'свої', + 'себе', + 'собі', + 'став', + 'суть', + 'така', + 'таке', + 'такі', + 'твоя', + 'твоє', + 'твій', + 'тебе', + 'тими', + 'тобі', + 'того', + 'тоді', + 'тому', + 'туди', + 'хоча', + 'хіба', + 'цими', + 'цієї', + 'часу', + 'чого', + 'чому', + 'який', + 'яких', + 'якої', + 'якщо', + 'ім\'я', + 'інша', + 'інше', + 'інші', + 'буває', + 'будеш', + 'більш', + 'вгору', + 'вміти', + 'внизу', + 'вісім', + 'давно', + 'даром', + 'добре', + 'довго', + 'друго', + 'дякую', + 'життя', + 'зараз', + 'знову', + 'какая', + 'кожен', + 'кожна', + 'кожне', + 'кожні', + 'краще', + 'ледве', + 'майже', + 'менше', + 'могти', + 'можна', + 'назад', + 'немає', + 'нижче', + 'нього', + 'однак', + 'п\'ять', + 'перед', + 'поруч', + 'потім', + 'проти', + 'після', + 'років', + 'самим', + 'самих', + 'самій', + 'свого', + 'своєї', + 'своїх', + 'собою', + 'справ', + 'такий', + 'також', + 'тепер', + 'тисяч', + 'тобою', + 'треба', + 'трохи', + 'усюди', + 'усіма', + 'хочеш', + 'цього', + 'цьому', + 'часто', + 'через', + 'шість', + 'якого', + 'іноді', + 'інший', + 'інших', + 'багато', + 'будемо', + 'будете', + 'будуть', + 'більше', + 'всього', + 'всьому', + 'далеко', + 'десять', + 'досить', + 'другий', + 'дійсно', + 'завжди', + 'звідси', + 'зовсім', + 'кругом', + 'кілька', + 'людина', + 'можуть', + 'навіть', + 'навіщо', + 'нагорі', + 'небудь', + 'низько', + 'ніколи', + 'нікуди', + 'нічого', + 'обидва', + 'одного', + 'однієї', + 'п\'ятий', + 'перший', + 'просто', + 'раніше', + 'раптом', + 'самими', + 'самого', + 'самому', + 'сказав', + 'скрізь', + 'сьомий', + 'третій', + 'тільки', + 'хотіти', + 'чотири', + 'чудово', + 'шостий', + 'близько', + 'важлива', + 'важливе', + 'важливі', + 'вдалині', + 'восьмий', + 'говорив', + 'дев\'ять', + 'десятий', + 'зайнята', + 'зайнято', + 'зайняті', + 'занадто', + 'значить', + 'навколо', + 'нарешті', + 'нерідко', + 'повинно', + 'посеред', + 'початку', + 'пізніше', + 'сказала', + 'сказати', + 'скільки', + 'спасибі', + 'частіше', + 'важливий', + 'двадцять', + 'дев\'ятий', + 'зазвичай', + 'зайнятий', + 'звичайно', + 'здається', + 'найбільш', + 'не можна', + 'недалеко', + 'особливо', + 'потрібно', + 'спочатку', + 'сьогодні', + 'численна', + 'численне', + 'численні', + 'відсотків', + 'двадцятий', + 'звідусіль', + 'мільйонів', + 'нещодавно', + 'прекрасно', + 'четвертий', + 'численний', + 'будь ласка', + 'дванадцять', + 'одинадцять', + 'сімнадцять', + 'тринадцять', + 'безперервно', + 'дванадцятий', + 'одинадцятий', + 'одного разу', + 'п\'ятнадцять', + 'сімнадцятий', + 'тринадцятий', + 'шістнадцять', + 'вісімнадцять', + 'п\'ятнадцятий', + 'чотирнадцять', + 'шістнадцятий', + 'вісімнадцятий', + 'дев\'ятнадцять', + 'чотирнадцятий', + 'дев\'ятнадцятий', +]; + +$result =& $data; +unset($data); +return $result; diff --git a/vendor/voku/stop-words/src/voku/helper/stopwords/vi.php b/vendor/voku/stop-words/src/voku/helper/stopwords/vi.php new file mode 100644 index 000000000..4a0ea9305 --- /dev/null +++ b/vendor/voku/stop-words/src/voku/helper/stopwords/vi.php @@ -0,0 +1,655 @@ +<?php + +// vietnamese + +static $data = [ + 'a ha', + 'a-lô', + 'ai', + 'ai ai', + 'ai nấy', + 'alô', + 'amen', + 'anh', + 'bao giờ', + 'bao lâu', + 'bao nhiêu', + 'bao nả', + 'bay biến', + 'biết', + 'biết bao', + 'biết bao nhiêu', + 'biết chừng nào', + 'biết mấy', + 'biết đâu', + 'biết đâu chừng', + 'biết đâu đấy', + 'bà', + 'bài', + 'bác', + 'bây bẩy', + 'bây chừ', + 'bây giờ', + 'bây nhiêu', + 'bèn', + 'béng', + 'bông', + 'bạn', + 'bản', + 'bất chợt', + 'bất cứ', + 'bất giác', + 'bất kì', + 'bất kể', + 'bất kỳ', + 'bất luận', + 'bất nhược', + 'bất quá', + 'bất thình lình', + 'bất tử', + 'bất đồ', + 'bấy', + 'bấy chầy', + 'bấy chừ', + 'bấy giờ', + 'bấy lâu', + 'bấy lâu nay', + 'bấy nay', + 'bấy nhiêu', + 'bập bà bập bõm', + 'bập bõm', + 'bắt đầu từ', + 'bằng', + 'bằng không', + 'bằng nấy', + 'bằng ấy', + 'bển', + 'bệt', + 'bị', + 'bỏ mẹ', + 'bỗng', + 'bỗng chốc', + 'bỗng dưng', + 'bỗng không', + 'bỗng nhiên', + 'bỗng đâu', + 'bộ', + 'bội phần', + 'bớ', + 'bởi', + 'bởi chưng', + 'bởi nhưng', + 'bởi thế', + 'bởi vì', + 'bởi vậy', + 'bức', + 'cao', + 'cha', + 'cha chả', + 'chao ôi', + 'chiếc', + 'cho', + 'cho nên', + 'cho tới', + 'cho tới khi', + 'cho đến', + 'cho đến khi', + 'choa', + 'chu cha', + 'chui cha', + 'chung cục', + 'chung qui', + 'chung quy', + 'chung quy lại', + 'chuyện', + 'chành chạnh', + 'chí chết', + 'chính', + 'chính là', + 'chính thị', + 'chùn chùn', + 'chùn chũn', + 'chú', + 'chú mày', + 'chú mình', + 'chúng mình', + 'chúng ta', + 'chúng tôi', + 'chăn chắn', + 'chăng', + 'chưa', + 'chầm chập', + 'chậc', + 'chắc', + 'chắc hẳn', + 'chẳng lẽ', + 'chẳng những', + 'chẳng nữa', + 'chẳng phải', + 'chết nỗi', + 'chết thật', + 'chết tiệt', + 'chỉ', + 'chỉn', + 'chốc chốc', + 'chớ', + 'chớ chi', + 'chợt', + 'chủn', + 'chứ', + 'chứ lị', + 'coi bộ', + 'coi mòi', + 'con', + 'cu cậu', + 'cuốn', + 'cuộc', + 'càng', + 'các', + 'cái', + 'cây', + 'còn', + 'có', + 'có chăng là', + 'có dễ', + 'có thể', + 'có vẻ', + 'cóc khô', + 'cô', + 'cô mình', + 'công nhiên', + 'cùng', + 'cùng cực', + 'cùng nhau', + 'cùng với', + 'căn', + 'căn cắt', + 'cũng', + 'cũng như', + 'cũng vậy', + 'cũng vậy thôi', + 'cơ', + 'cơ chừng', + 'cơ hồ', + 'cơ mà', + 'cơn', + 'cả', + 'cả thảy', + 'cả thể', + 'cảm ơn', + 'cần', + 'cật lực', + 'cật sức', + 'cậu', + 'cổ lai', + 'của', + 'cứ', + 'cứ việc', + 'cực lực', + 'do', + 'do vì', + 'do vậy', + 'do đó', + 'duy', + 'dào', + 'dì', + 'dù cho', + 'dù rằng', + 'dưới', + 'dạ', + 'dần dà', + 'dần dần', + 'dầu sao', + 'dẫu', + 'dẫu sao', + 'dễ sợ', + 'dễ thường', + 'dở chừng', + 'dữ', + 'em', + 'giữa', + 'gì', + 'hay', + 'hoàn toàn', + 'hoặc', + 'hơn', + 'hầu hết', + 'họ', + 'hỏi', + 'khi', + 'khác', + 'không', + 'luôn', + 'là', + 'làm', + 'lên', + 'lúc', + 'lại', + 'lần', + 'lớn', + 'muốn', + 'mà', + 'mình', + 'mỗi', + 'một', + 'một cách', + 'mới', + 'mợ', + 'ngay', + 'ngay cả', + 'ngay khi', + 'ngay lúc', + 'ngay lập tức', + 'ngay tức khắc', + 'ngay từ', + 'nghe chừng', + 'nghe đâu', + 'nghen', + 'nghiễm nhiên', + 'nghỉm', + 'ngoài', + 'ngoài ra', + 'ngoải', + 'ngày', + 'ngày càng', + 'ngày ngày', + 'ngày xưa', + 'ngày xửa', + 'ngôi', + 'ngõ hầu', + 'ngăn ngắt', + 'ngươi', + 'người', + 'ngọn', + 'ngọt', + 'ngộ nhỡ', + 'nh', + 'nhau', + 'nhiên hậu', + 'nhiều', + 'nhiệt liệt', + 'nhung nhăng', + 'nhà', + 'nhân dịp', + 'nhân tiện', + 'nhé', + 'nhón nhén', + 'như', + 'như chơi', + 'như không', + 'như quả', + 'như thể', + 'như tuồng', + 'như vậy', + 'nhưng', + 'nhưng mà', + 'nhược bằng', + 'nhất', + 'nhất loạt', + 'nhất luật', + 'nhất mực', + 'nhất nhất', + 'nhất quyết', + 'nhất sinh', + 'nhất thiết', + 'nhất tâm', + 'nhất tề', + 'nhất đán', + 'nhất định', + 'nhận', + 'nhỉ', + 'nhỡ ra', + 'những', + 'những ai', + 'những như', + 'nào', + 'này', + 'nên', + 'nên chi', + 'nó', + 'nóc', + 'nói', + 'năm', + 'nơi', + 'nấy', + 'nếu', + 'nếu như', + 'nền', + 'nọ', + 'nớ', + 'nức nở', + 'nữa', + 'oai oái', + 'oái', + 'pho', + 'phè', + 'phóc', + 'phót', + 'phăn phắt', + 'phương chi', + 'phải', + 'phải chi', + 'phải chăng', + 'phắt', + 'phỉ phui', + 'phỏng', + 'phỏng như', + 'phốc', + 'phụt', + 'phứt', + 'qua', + 'qua quít', + 'qua quýt', + 'quyết', + 'quyết nhiên', + 'quyển', + 'quá', + 'quá chừng', + 'quá lắm', + 'quá sá', + 'quá thể', + 'quá trời', + 'quá xá', + 'quá đỗi', + 'quá độ', + 'quá ư', + 'quý hồ', + 'quả', + 'quả là', + 'quả tang', + 'quả thật', + 'quả tình', + 'quả vậy', + 'quả đúng', + 'ra', + 'ra phết', + 'ra sao', + 'ra trò', + 'ren rén', + 'riu ríu', + 'riêng', + 'riệt', + 'rày', + 'ráo', + 'ráo trọi', + 'rén', + 'rích', + 'rón rén', + 'rút cục', + 'răng', + 'rất', + 'rằng', + 'rằng là', + 'rốt cuộc', + 'rốt cục', + 'rồi', + 'rứa', + 'sa sả', + 'sao', + 'sau', + 'sau chót', + 'sau cuối', + 'sau cùng', + 'sau đó', + 'so', + 'song le', + 'suýt', + 'sì', + 'sạch', + 'sất', + 'sắp', + 'sẽ', + 'số', + 'số là', + 'sốt sột', + 'sở dĩ', + 'sự', + 'tanh', + 'tha hồ', + 'than ôi', + 'thanh', + 'theo', + 'thi thoảng', + 'thoạt', + 'thoạt nhiên', + 'thoắt', + 'thuần', + 'thà', + 'thà là', + 'thà rằng', + 'thành ra', + 'thành thử', + 'thái quá', + 'tháng', + 'thì', + 'thì thôi', + 'thình lình', + 'thím', + 'thôi', + 'thúng thắng', + 'thương ôi', + 'thường', + 'thảo hèn', + 'thảo nào', + 'thấy', + 'thẩy', + 'thậm', + 'thậm chí', + 'thật lực', + 'thật ra', + 'thật vậy', + 'thế', + 'thế là', + 'thế mà', + 'thế nào', + 'thế nên', + 'thế ra', + 'thế thì', + 'thế à', + 'thếch', + 'thỉnh thoảng', + 'thỏm', + 'thốc', + 'thốc tháo', + 'thốt', + 'thốt nhiên', + 'thộc', + 'thời gian', + 'thục mạng', + 'thửa', + 'thực ra', + 'thực sự', + 'thực vậy', + 'tiếp theo', + 'tiếp đó', + 'tiện thể', + 'toà', + 'toé khói', + 'toẹt', + 'trong', + 'trên', + 'trước', + 'trước kia', + 'trước nay', + 'trước tiên', + 'trước đây', + 'trước đó', + 'trếu tráo', + 'trển', + 'trệt', + 'trệu trạo', + 'trỏng', + 'trời đất ơi', + 'trừ phi', + 'tuy', + 'tuy nhiên', + 'tuy rằng', + 'tuy thế', + 'tuy vậy', + 'tuyệt nhiên', + 'tuần tự', + 'tuốt luốt', + 'tuốt tuồn tuột', + 'tuốt tuột', + 'tà tà', + 'tênh', + 'tít mù', + 'tò te', + 'tôi', + 'tông tốc', + 'tù tì', + 'tăm tắp', + 'tại', + 'tại vì', + 'tấm', + 'tấn', + 'tất cả', + 'tất thảy', + 'tất tần tật', + 'tất tật', + 'tắp', + 'tắp lự', + 'tọt', + 'tỏ ra', + 'tỏ vẻ', + 'tốc tả', + 'tối ư', + 'tột', + 'tớ', + 'tới', + 'tức thì', + 'tức tốc', + 'từ', + 'từng', + 'tự vì', + 'tựu trung', + 'veo', + 'veo veo', + 'việc', + 'vung thiên địa', + 'vung tàn tán', + 'vung tán tàn', + 'và', + 'vào', + 'vâng', + 'vèo', + 'vì', + 'vì chưng', + 'vì thế', + 'vì vậy', + 'ví bằng', + 'ví dù', + 'ví phỏng', + 'ví thử', + 'vô hình trung', + 'vô kể', + 'vô luận', + 'vô vàn', + 'văng tê', + 'vạn nhất', + 'vả chăng', + 'vả lại', + 'vẫn', + 'vậy', + 'vậy là', + 'vậy thì', + 'về', + 'vị tất', + 'vốn dĩ', + 'với', + 'với lại', + 'vở', + 'vụt', + 'vừa', + 'vừa mới', + 'xa xả', + 'xiết bao', + 'xon xón', + 'xoành xoạch', + 'xoét', + 'xoẳn', + 'xoẹt', + 'xuất kì bất ý', + 'xuất kỳ bất ý', + 'xuể', + 'xuống', + 'xăm xúi', + 'xăm xăm', + 'xăm xắm', + 'xềnh xệch', + 'xệp', + 'à', + 'à ơi', + 'ào', + 'á', + 'á à', + 'ái', + 'ái chà', + 'ái dà', + 'áng', + 'âu là', + 'ô hay', + 'ô hô', + 'ô kê', + 'ô kìa', + 'ôi chao', + 'ôi thôi', + 'ông', + 'úi', + 'úi chà', + 'úi dào', + 'ý', + 'ý chừng', + 'ý da', + 'đang', + 'đi', + 'điều', + 'đành đạch', + 'đáng lí', + 'đáng lý', + 'đáng lẽ', + 'đánh đùng', + 'đáo để', + 'đây', + 'đã', + 'đó', + 'được', + 'đại loại', + 'đại nhân', + 'đại phàm', + 'đại để', + 'đến', + 'đến nỗi', + 'đều', + 'để', + 'ơ', + 'ơ hay', + 'ơ kìa', + 'ơi', + 'ư', + 'ạ', + 'ạ ơi', + 'ấy', + 'ầu ơ', + 'ắt', + 'ắt hẳn', + 'ắt là', + 'ối dào', + 'ối giời', + 'ối giời ơi', + 'ồ', + 'ổng', + 'ớ', + 'ờ', + 'ở', + 'ở trên', + 'ủa', + 'ứ hự', + 'ứ ừ', + 'ừ', + 'ử', +]; + +$result =& $data; +unset($data); +return $result; |