Channels - SmartEval: A Benchmark for Evaluating LLM-Generated Smart Contracts from Natural Language Specifications :: FRELIP Discovery

Similar Items: SmartEval: A Benchmark for Evaluating LLM-Generated Smart Contracts from Natural Language Specifications

Quick Look
FlowEval: Reference-based Evaluation of Generated User Interfaces
Quick Look
A Language for Describing Agentic LLM Contexts
Quick Look
Governing What the EU AI Act Excludes: Accountability for Autonomous AI Agents in Smart City Critical Infrastructure
Quick Look
Foresight Arena: An On-Chain Benchmark for Evaluating AI Forecasting Agents
Quick Look
LLM-Foraging: Large Language Models for Decentralized Swarm Robot Foraging
Quick Look
RunAgent: Interpreting Natural-Language Plans with Constraint-Guided Execution
Quick Look
LLM-enabled Social Agents
Quick Look
Tailored Prompts, Targeted Protection: Vulnerability-Specific LLM Analysis for Smart Contracts
Quick Look
EnactToM: An Evolving Benchmark for Functional Theory of Mind in Embodied Agents
Quick Look
Agent Island: A Saturation- and Contamination-Resistant Benchmark from Multiagent Games
Quick Look
Pythia: Toward Predictability-Driven Agent-Native LLM Serving
Quick Look
Coordination as an Architectural Layer for LLM-Based Multi-Agent Systems
Quick Look
Deterministic vs. LLM-Controlled Orchestration for COBOL-to-Python Modernization
Quick Look
AgenticPrecoding: LLM-Empowered Multi-Agent System for Precoding Optimization
Quick Look
The $textit{Silicon Society}$ Cookbook: Design Space of LLM-based Social Simulations
Quick Look
Governed Collaborative Memory as Artificial Selection in LLM-Based Multi-Agent Systems
Quick Look
Active Learning for Communication Structure Optimization in LLM-Based Multi-Agent Systems
Quick Look
The Memory Curse: How Expanded Recall Erodes Cooperative Intent in LLM Agents
Quick Look
Bridging the Last Mile of Circuit Design: PostEDA-Bench, a Hierarchical Benchmark for PPA Convergence and DRC Fixing
Quick Look
When Embedding-Based Defenses Fail: Rethinking Safety in LLM-Based Multi-Agent Systems
Quick Look
When Stress Becomes Signal: Detecting Antifragility-Compatible Regimes in Multi-Agent LLM Systems
Quick Look
When Roles Fail: Epistemic Constraints on Advocate Role Fidelity in LLM-Based Political Statement Analysis
Quick Look
Collective Alignment in LLM Multi-Agent Systems: Disentangling Bias from Cooperation via Statistical Physics
Quick Look
Enwar 3.0: An Agentic Multi-Modal LLM Orchestrator for Situation-Aware Beamforming, Blockage Prediction, and Handover Management