Feat/feasibility check by voorhs · Pull Request #291 · deeppavlov/AutoIntent

voorhs · 2026-05-23T16:32:40Z

No description provided.

- proposal: introduce 3-phase framing (resource/data/config), add resource-phase refinements (warm cache, n_jobs × VRAM, refit_after, Hub reachability, CatBoost GPU sanity), data-quality phase (token truncation, split readiness, partial descriptions, embedder dim), config sanity phase, updated example output, CLI surface, out-of- scope deferrals - _advisor package: hardware detection (CUDA/MPS/CPU with broken-CUDA fallback), HF Hub metadata + warm-cache probe + offline heuristics, three-phase run_preflight returning structured PreflightReport, text + JSON renderers - autointent-advisor CLI: inspect <preset|config> and recommend subcommands; placeholder dataset stats when no --dataset given - 88 offline tests covering hardware fallbacks, every bundled preset, severity routing, report serialization, name-pattern heuristics, AMP invariant, dump_modules / refit_after, CLI flows Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>

voorhs · 2026-06-17T18:44:14Z

 SearchSpacePreset = Literal[
-    "classic-heavy",
-    "classic-light",
-    "classic-medium",
-    "nn-heavy",
-    "nn-medium",
    "transformers-heavy",
    "transformers-light",
-    "transformers-no-hpo",
+    "nn-heavy",
    "zero-shot-llm",
+    "nn-medium",
+    "classic-heavy",
+    "transformers-no-hpo",
+    "classic-medium",
    "zero-shot-encoders",
+    "classic-light",
 ]
-"""Some presets that our library supports."""
+"""Bundled search-space presets, listed in descending quality order.
+
+The order is consumed by ``autointent._advisor.recommend`` to pick the
+highest-quality feasible preset (lower index = higher quality)."""


это к сожалению неправда - выстроить пресеты в какой-то один порядок нельзя потому что под разные задачи нужны разные пресеты

например transformers-heavy будет ужасно работать если выборка маленькая

Тут скорее по времени выполнения

тогда надо докстринг изменить, сейчас он вводит в заблуждение читателей документации

voorhs · 2026-06-17T19:11:27Z

+    if mixed_precision:
+        bytes_per_sample //= 2


тут не совсем такая формула, там же куча мастер копий еще - мне кажется стоит уточнить этот момент

такое сокращение может быть, но это слишком оптимистичная оценка - а мы хотим оценить затраты сверху а не снизу

voorhs · 2026-06-17T19:38:32Z

немного странно что цпу никак не влияет на оценки времени

voorhs

в целом по методике и алгоритам ок за исключением мелочей которые прокомментил (посмотрел не прямо все но пока это стоит исправить)

есть два пожелания:

наверное стоит добавить какой-то обоснованности всем используемым формулам (ссылки на внешние ресурсы, бенчмарки, статьи в которых исследуется такое) - вообще с этого стоило начать выполнение этой задачи)
очень неудобно ревьюить когда в одном бульоне приватные утилиты и публичные функции, мне кажется стоит руками самому как-то разнести все это на подфайлы и подпапки, потому что иишке это ок, а человечески очень тяжело когда файл на 800 строк и в нем центральный публичный метод с главным алгоритмом спрятан где-то посередине или в конце

voorhs

норм

# Conflicts: # pyproject.toml

voorhs · 2026-06-25T18:54:24Z

+    # rare class x linear-CV (LogisticRegressionCV cv=3 needs >=3 samples/class;
+    # multilabel path uses one-vs-rest without CV so the failure can't occur there)
+    has_linear = any(e.get("module_name") == "linear" for _, e in _walk_modules(search_space))
+    if has_linear and stats.rare_classes and not stats.multilabel:
+        report.add(
+            "data",
+            Severity.OVER,
+            f"LogisticRegressionCV (cv=3) will fail: classes {stats.rare_classes[:5]} have <3 samples.",
+        )


я не знаю есть ли тут баг, но на всякий случай перепроверь пожалуйста что эта проверка использует нужные сплиты (train/val/test) и не противоречит check_split_readiness в подмодуле data_handler

а еще тут полагается что cv=3, но это же не всегда так

voorhs

норм! концептуально и по коду лучше, теперь это надо встроить в Pipeline.fit()

а еще надо провести эксперимент который оценивает насколько хорошо эта штука работает. у меня в голове такой дизайн: берешь как можно больше разных машин (нашу виртуалку, узел нашего кластера, свой ноутбук, свой другой ноутбук, свой пк), берешь разные серч спейсы и 2-3 датасета - и смотришь фолз/тру позитивы, фолз/тру негативы

если оформишь код в AutoIntent-experiments, то я на своих машинах тоже запущу и добавлю тебе кейсов в отчет

voorhs · 2026-06-25T19:50:32Z

еще кстати есть такой вопрос: текущая реализация как-то учитывает кеширование эмбедингов? я могу потом как нибудь у клодика спросить, написал сюда чтобы не забыть (ну или может ты ответишь)

voorhs and others added 11 commits May 23, 2026 19:31

add spec

b6be787

pull dev

d5d2d29

upd tech spec

dceb985

fix

c8675b9

Merge branch 'dev' into feat/feasibility-check

ad2c3bb

add more handling

f927729

add more handling

82a7828

fix typing & lint

bbb039e

Merge branch 'dev' into feat/feasibility-check

4e1966c

try to fix typing

334783c

Samoed marked this pull request as ready for review June 16, 2026 15:09

Samoed added 7 commits June 16, 2026 18:10

roll back config changes

4e4da91

move cli logic

8bd0b01

simplify logic

b77d575

simplify logic

1f1778a

remove from init

e0f1486

revert pyproject.toml

6496b4e

update typing

bc3df74

voorhs commented Jun 17, 2026

View reviewed changes

Comment thread src/autointent/_advisor/_estimates.py Outdated

voorhs commented Jun 17, 2026

View reviewed changes

refactor

7cb0f53

voorhs commented Jun 24, 2026

View reviewed changes

Samoed added 4 commits June 24, 2026 15:38

commit missing files

1841d08

Merge branch 'dev' into feat/feasibility-check

b79d83e

# Conflicts: # pyproject.toml

fix typing

bfd5e0c

fix typing

319d88e

fix test

908b28d

voorhs commented Jun 25, 2026

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Feat/feasibility check#291

Feat/feasibility check#291
voorhs wants to merge 24 commits into
devfrom
feat/feasibility-check

voorhs commented May 23, 2026

Uh oh!

voorhs Jun 17, 2026

Uh oh!

Samoed Jun 17, 2026

Uh oh!

voorhs Jun 17, 2026

Uh oh!

voorhs Jun 17, 2026 •

edited

Loading

Uh oh!

Uh oh!

voorhs Jun 17, 2026

Uh oh!

voorhs left a comment

Uh oh!

voorhs left a comment

Uh oh!

voorhs Jun 25, 2026

Uh oh!

voorhs Jun 25, 2026

Uh oh!

voorhs left a comment

Uh oh!

voorhs commented Jun 25, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Uh oh!

Conversation

voorhs commented May 23, 2026

Uh oh!

voorhs Jun 17, 2026

Choose a reason for hiding this comment

Uh oh!

Samoed Jun 17, 2026

Choose a reason for hiding this comment

Uh oh!

voorhs Jun 17, 2026

Choose a reason for hiding this comment

Uh oh!

voorhs Jun 17, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Uh oh!

voorhs Jun 17, 2026

Choose a reason for hiding this comment

Uh oh!

voorhs left a comment

Choose a reason for hiding this comment

Uh oh!

voorhs left a comment

Choose a reason for hiding this comment

Uh oh!

voorhs Jun 25, 2026

Choose a reason for hiding this comment

Uh oh!

voorhs Jun 25, 2026

Choose a reason for hiding this comment

Uh oh!

voorhs left a comment

Choose a reason for hiding this comment

Uh oh!

voorhs commented Jun 25, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

voorhs Jun 17, 2026 •

edited

Loading