Visual Basic Token Web API

TCFormer: Visual Recognition via Token Clustering Transformer

Abstract: Transformers are widely used in computer vision areas and have achieved remarkable success. Most state-of-the-art approaches split images into regular grids and represent each grid region ...

TMCnet

XPENG-Peking University Collaborative Research Accepted by AAAI 2026: Introducing a Novel Visual Token Pruning Framework for Autonomous Driving

GUANGZHOU, China, Dec. 28, 2025 /PRNewswire/ -- XPENG, in collaboration with Peking University, has had its paper "FastDriveVLA: Efficient End-to-End Driving via Plug-and-Play Reconstruction-based ...

The Chanticleer

XPENG-Peking University Collaborative Research Accepted by AAAI 2026: Introducing a Novel Visual Token Pruning Framework for Autonomous Driving

XPENG-PKU Research Breakthrough: XPENG, in collaboration with Peking University, has developed FastDriveVLA—a novel visual token pruning framework that enables autonomous driving AI to "drive like a ...

blockchain

Chain-of-Visual-Thought (COVT): Revolutionizing Visual Language Models with Continuous Visual Tokens for Enhanced Perception

According to @godofprompt, the new research paper 'Chain-of-Visual-Thought (COVT)' introduces a breakthrough method for Visual Language Models (VLMs) by enabling them to reason using continuous visual ...

Forbes

Show inaccessible results

TCFormer: Visual Recognition via Token Clustering Transformer

XPENG-Peking University Collaborative Research Accepted by AAAI 2026: Introducing a Novel Visual Token Pruning Framework for Autonomous Driving

XPENG-Peking University Collaborative Research Accepted by AAAI 2026: Introducing a Novel Visual Token Pruning Framework for Autonomous Driving

Chain-of-Visual-Thought (COVT): Revolutionizing Visual Language Models with Continuous Visual Tokens for Enhanced Perception

The Surprising Idea That Generative AI Might Be Better Off Using Visual Images Of Text Rather Than Pure Text As Tokens

DeepSeek's new V3.2-Exp model cuts API pricing in half to less than 3 cents per 1M input tokens

Visual Crossing Adds Real-Time Radar to Its Weather API, Starting in the U.S. and Europe

Claude gets 1M tokens support via API to take on Gemini 2.5 Pro

VFlowOpt: A Token Pruning Framework for LMMs with Visual Information Flow-Guided Optimization