Ziwei Liu(@liuziwei7) 's Twitter Profile Photo

📢LLaVA-NeXT(-Video) Announced📢

* LLaVA-NeXT is one of the most competitive open-source VLM nowadays towards GPT4-V

* LLaVA-NeXT-Video extends this capability to long videos, outperforming all existing video LLMs

- Blog: llava-vl.github.io/blog/2024-04-3…
- Code: github.com/LLaVA-VL/LLaVA…

📢LLaVA-NeXT(-Video) Announced📢

* LLaVA-NeXT is one of the most competitive open-source VLM nowadays towards GPT4-V

* LLaVA-NeXT-Video extends this capability to long videos, outperforming all existing video LLMs

- Blog: llava-vl.github.io/blog/2024-04-3…
- Code: github.com/LLaVA-VL/LLaVA…
account_circle
Hongxu (Danny) Yin(@yin_hongxu) 's Twitter Profile Photo

📢 We release VILA, a visual language model (VLM) family for image and video understanding, fastest on NVIDIA GPU/Orin! VILA achieves state-of-the-art accuracy among open source VLMs on the MMMU dataset. CVPR'24 paper: arxiv.org/pdf/2312.07533
Code: github.com/Efficient-Larg…

account_circle
海瀬 稜創 / umise(@UiE029) 's Twitter Profile Photo

huggingface.co/Local-Novel-LL…
VecteusのVLM版を公開しました。
普通のLLavaみたいに画像を見せてチャットみたいなことができます

account_circle
エクスヴェリア【nZk】【emU】(@nZk1015) 's Twitter Profile Photo

Ninjaシリーズ最新版 Ocuteusを公開しました。
VecteusをVLM(視覚)に対応させました。
GGUFのリポジトリ内にollama用のテンプレートもあります。
また、kobold.cppなら画像のリサイズ機能も付いているため手軽に試せます。

huggingface.co/Local-Novel-LL…
huggingface.co/Local-Novel-LL…

account_circle
真波まなみ☆。.:*・゜(@nf_vlm) 's Twitter Profile Photo

黒猫メイド☆メイドの日☆オリジナル☆手描きイラスト☆ メイドの日遅刻しました( ´⚰︎`°。)黒猫メイドちゃんです!
気に入っていただける方はよろしくお願いいたします(´∩ω∩`*) page.auctions.yahoo.co.jp/jp/auction/113…

黒猫メイド☆メイドの日☆オリジナル☆手描きイラスト☆ メイドの日遅刻しました(   ´⚰︎`°。)黒猫メイドちゃんです!
気に入っていただける方はよろしくお願いいたします(´∩ω∩`*) page.auctions.yahoo.co.jp/jp/auction/113…
account_circle
Ziwei Liu(@liuziwei7) 's Twitter Profile Photo

🔥Benchmarking Multimodal World Knowledge🔥

We present 🌎 🌎, a video understanding dataset for pushing world model capability in VLM with *multimodal inputs*, *world knowledge* and *long-chain reasoning*

- Project: zhangyuanhan-ai.github.io/WorldQA/
- Code: github.com/EvolvingLMMs-L…

account_circle
batuhan (e/single)(@isidentical) 's Twitter Profile Photo

VLM developers don't want you to know this one simple trick that can make your inference 2x faster github.com/InternLM/lmdep…

account_circle